W ciągu zaledwie dwóch dni DeepSeek wywrócił do góry nogami rynek AI i sprawił, że akcje firm technologicznych straciły około 1 biliona dolarów na wartości. Kto stoi za tym chińskim startupem, który wstrząsnął amerykańskimi gigantami i innymi globalnymi spółkami będącymi częścią łańcucha dostaw AI? Chińskim Samem Altmanem jest 40-letni Liang Wenfeng - założyciel startupu DeepSeek, który szybko stał się największym konkurentem OpenAI. Co ciekawe, nie ma on przeszłości technologicznej, wywodzi się mianowicie ze świata finansów. W 2015 roku, po ukończeniu studiów na Uniwersytecie Zhejiang, Wenfeng i dwóch jego kolegów z tego uniwersytetu, stworzyli fundusz hedgingowy High-Flyer. Jak podaje jego strona internetowa - opiera się on na matematyce i sztucznej inteligencji w zakresie ilościowych inwestycji. W kolejnych latach fundusz szybko rozwijał się, stając się pierwszym w Chinach funduszem hedgingowym, który zebrał ponad 15 miliardów dolarów. Dzięki unikalnemu modelowi finansowania i zainteresowaniu przewidywaniem trendów rynkowych za pomocą AI, Wenfeng mógł realizować projekty z zakresu sztucznej inteligencji bez presji ze strony zewnętrznych inwestorów. Postawił zamiast tego na długoterminowe badania i rozwój. Już w 2021 roku - na długo zanim administracja prezydenta Bidena zaczęła ograniczać dostawy chipów AI do Chin - Wenfeng rozpoczął kupowanie tysięcy chipów Nvidia w ramach pobocznego projektu AI. „Kiedy go poznaliśmy, był bardzo kujonowatym facetem z okropną fryzurą, który mówił o zbudowaniu klastra 10 000 chipów do trenowania własnych modeli. Nie traktowaliśmy go poważnie. Nie potrafił wyrazić swojej wizji inaczej niż mówiąc: "Chcę to zbudować i to będzie zmiana zasad gry”. Myśleliśmy, że jest to możliwe tylko u takich gigantów jak ByteDance czy Alibaba” - powiedział jeden z partnerów biznesowych Lianga Wenfenga w wywiadzie dla Financial Times. A już w 2022 roku jednostka AI High-Flyer poinformowała, że posiada i obsługuje klaster 10 000 układów A100, jak podał Reuters. Rozwój DeepSeek Wynika z tego, że Wenfeng z góry założył sobie, iż DeepSeek stanie się chińskim liderem AI, który będzie konkurować z amerykańskimi gigantami technologicznymi. Aby to uczynić zrekrutował najlepsze młode talenty, oferując im pensje porównywalne z tymi, które płacą czołowe chińskie firmy technologiczne, takie jak ByteDance. Warto podkreślić, że nie szukał doświadczonych inżynierów AI, zwrócił się natomiast do doktorantów z najlepszych chińskich uniwersytetów - takich jak Uniwersytet Pekiński i Tsinghua. A w 2023 roku powołał do życia startup DeepSeek. Co ciekawe, Liang Wenfeng prowadzi DeepSeek jako firmę oddolną bez żadnych przypisanych z góry ról, ani sztywnej hierarchii. W jednym z wywiadów powiedział: „Uważam, że innowacja jest przede wszystkim kwestią wiary. Dlaczego Dolina Krzemowa jest tak innowacyjna? Ponieważ odważnie próbują. Kiedy zadebiutował ChatGPT, Chiny nie miały zaufania do pionierskich badań. Od inwestorów po duże firmy technologiczne, wielu uważało, że luka jest zbyt duża i zamiast tego skupiało się na aplikacjach. Ale innowacja wymaga pewności siebie, a młodzi ludzie mają jej więcej”. Pierwszy model AI firmy DeepSeek, DeepSeek Coder, wydano jako model typu open source przeznaczony do zadań kodowania. Następnie pojawił się DeepSeek LLM, którego celem była konkurencja z innymi dużymi modelami językowymi. W maju 2024 roku wydano DeepSeek-V2, który został w Chinach dobrze przyjęty ze względu na wysoką wydajność i niski koszt. Na tamtejszym rynku AI wybuchła nawet wojna cenowa, która zmusiła głównych chińskich gigantów technologicznych - takich jak ByteDance, Tencent, Baidu i Alibaba - do obniżenia cen swoich modeli AI, aby pozostać konkurencyjnymi. Następcą DeepSeek-V2 został DeepSeek-Coder-V2, znacznie bardziej zaawansowany model z 236 miliardami parametrów i kontekstem sięgającym 128 tys. tokenów. Najnowsze modele firmy, DeepSeek-V3 i DeepSeek-R1ugruntowały pozycję DeepSeek jako wiodącego laboratorium badawczego AI w Chinach i namieszały na globalnym rynku AI. Zwłaszcza DeepSeek-R1, wydany w styczniu br. rzucił wyzwanie modelowi GPT-4 OpenAI. Przedstawiciele DeepSeek stwierdzili, że na model R1 wydali zaledwie ok. 6 miliona dolarów - w porównaniu do setek milionów, a nawet miliardów dolarów, które amerykańskie firmy wydają na swoje technologie AI. Jego niskie koszty operacyjne zszokowały amerykańskie firmy technologiczne, a aplikacja DeepSeek znalazła się na szczycie listy najpopularniejszych aplikacji w USA, detronizując ChatGPT. Jak do tego doszło? Jak powiedziała The Wired, Wendy Chang, inżynier oprogramowania, analityczka w Mercator Institute for China Studies: „Badacze DeepSeek zoptymalizowali architekturę swojego modelu, wykorzystując całą masę sztuczek inżynieryjnych - niestandardowe schematy komunikacji między chipami, zmniejszając rozmiar pól w celu oszczędzania pamięci i innowacyjne wykorzystanie podejścia mieszania modeli. Wiele z tych podejść to nie są nowe pomysły, ale ich udane połączenie w celu stworzenia najnowocześniejszego modelu to niezwykłe osiągnięcie”. Ambicje Liana Wenfenga W wywiadzie dla Waves - z lipca 2024 roku - Lian Wenfeng określił swoje ambicje dotyczących DeepSeek i ogólnej strategii AI Chin: „Przez lata chińskie firmy przyzwyczaiły się do wykorzystywania innowacji technologicznych opracowanych gdzie indziej i monetyzacji ich za pośrednictwem aplikacji. Ale to nie jest zrównoważone podejście. Tym razem naszym celem nie są szybkie zyski, ale przesunięcie granicy technologicznej w celu napędzania wzrostu ekosystemu”. Z kolei Firstpost cytuje taką wypowiedź szefa DeepSeek: „Widzimy, że chińska sztuczna inteligencja nie może wiecznie pozostawać w pozycji naśladowcy. Często mówimy, że między Chinami a USA jest jedno- lub dwuletnia luka, ale prawdziwa luka jest między oryginalnością a imitacją. Jeśli to się nie zmieni, Chiny zawsze będą naśladowcą. Dlatego pewne eksploracje są nieuniknione”. Dodajmy jednak, że według najnowszych informacji istnieje podejrzenie, że DeepSeek uzyskał dane od OpenAI w sposób nieautoryzowany. Źródła: Reuters, Financial Times, Firstpost, The IndianExpress, Waves, The Wired.