Sztuczna inteligencjaRynekPolecane tematy

DeepSeek pokazuje V4: nowy model AI z 1 mln tokenów stawia na chipy Huawei zamiast Nvidii

Chiński startup DeepSeek zaprezentował wersję preview modelu V4 – jednego z największych systemów AI na rynku, oferującego okno kontekstowe sięgające 1 mln tokenów. Nowa architektura, rozwijana we współpracy z Huawei, nie tylko znacząco zwiększa możliwości przetwarzania danych, ale też sygnalizuje strategiczne odejście od infrastruktury opartej dotąd głównie na rozwiązaniach Nvidia.

DeepSeek pokazuje V4: nowy model AI z 1 mln tokenów stawia na chipy Huawei zamiast Nvidii

Jak podaje Reuters, model V4 w wersji Pro osiąga wyniki lepsze niż większość dostępnych modeli open source, ustępując jedynie zamkniętemu modelowi Gemini-Pro-3.1 od Google. Równolegle firma udostępniła także tańszą wersję Flash.

V4-pro może pochwalić się liczbą 1,6 biliona parametrów, co czyni go największym modelem firmy pod tym względem. Oferuje „tryb maksymalnego wysiłku rozumowania”, który, jak twierdzi chiński startup, „znacznie zwiększa możliwości modeli open source w zakresie wiedzy, umacniając swoją pozycję najlepszego dostępnego obecnie modelu open source”. V4-flash ma z kolei 284 miliardy parametrów i jest „bardziej wydajnym oraz ekonomicznym wyborem”.

Oba modele posiadają okno kontekstowe o imponującej pojemności aż 1 miliona tokenów, co jest kluczową cechą określającą ilość informacji, jaką system sztucznej inteligencji jest w stanie przetworzyć. Według DeepSeek, zostało to osiągnięte z „wiodącą na świecie” efektywnością kosztową. Przypomnijmy, że poprzedni flagowy model chińskiego startupu V3 posiadał okno kontekstowe o pojemności 128 000 tokenów.

Debiut modelu V4 w formule open source i takich parametrach podważa dominację drogich, zamkniętych ekosystemów AI.

Technologia i strategia: Huawei zamiast Nvidii

Współpraca z Huawei ma kluczowe znaczenie w kontekście ograniczeń eksportowych nakładanych przez USA.  Chiński producent potwierdził, że jego superwęzeł Ascend, który obsługuje flagowe chipy AI Ascend 950, będzie w pełni obsługiwał modele DeepSeek V4. W niedawnym raporcie podano też, iż DeepSeek trenował swoje modele V4 właśnie na krzemie Huawei.

Choć startup nie ujawnił szczegółów dotyczących procesu treningu, sygnalizuje się wykorzystanie zarówno chipów Nvidii, jak i Huawei. To pokazuje etap przejściowy – od zależności od amerykańskich dostawców do budowy własnego, suwerennego stosu technologicznego.

AI w centrum napięć USA-Chiny

Premiera modelu zbiegła się w czasie z zaostrzeniem retoryki Waszyngtonu wobec Pekinu. Amerykańska administracja oskarżyła Chiny o „systemową kradzież własności intelektualnej” w sektorze AI, a sam DeepSeek znalazł się pod presją zarzutów o obchodzenie kontroli eksportu oraz wykorzystywanie technik destylacji modeli konkurencji, w tym rozwiązań OpenAI i Anthropic.

Przedstawiciele chińskiego startupu odpierają zarzuty, podkreślając, że ich modele bazują na publicznie dostępnych danych oraz własnych metodach trenowania. Pekin z kolei oficjalnie sprzeciwił się oskarżeniom, deklarując przywiązanie do ochrony własności intelektualnej.

Rynek reaguje: inwestorzy stawiają na lokalny ekosystem

Premiera V4 już wyraźnie wpłynęła na rynek. Akcje chińskich producentów chipów – w tym SMIC czy Hua Hong – rosły nawet o kilkanaście procent, co odzwierciedla rosnący optymizm wokół krajowego łańcucha dostaw AI.

Jednocześnie konkurenci DeepSeek, tacy jak Zhipu AI czy MiniMax, odnotowali spadki kursów (odpowiednio 9 i 7%), co pokazuje skalę presji konkurencyjnej wywołanej nowym modelem.

DeepSeek kontynuuje strategię tanich, wydajnych modeli open source, która już wcześniej pozwoliła mu zdobyć globalną uwagę. Według doniesień The Information, firma należąca do chińskiego funduszu High-Flyer Capital Management, może wkrótce pozyskać finansowanie przy wycenie przekraczającej 20 mld dolarów, a zainteresowanie inwestycyjne wykazują m.in. Alibaba i Tencent.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *