Sztuczna inteligencjaRynek
Nowy model DeepSeek R1-0528 trafił na Hugging Face
Chiński startup DeepSeek opublikował aktualizację swojego flagowego modelu rozumowania. R1-0528 trafił na platformę deweloperską Hugging Face, ale nie opublikowano jeszcze oficjalnego ogłoszenia publicznego, opisu modelu ani porównań. Czy nowy R1 znów stanie się realną konkurencją dla amerykańskich modeli od OpenAI?
Repozytorium Hugging Face nie zawiera opisu chińskiego modelu – tylko pliki konfiguracyjne i wagi, wewnętrzne komponenty modelu, które kierują jego zachowaniem. Zaktualizowany R1, ważący 685 miliardów parametrów, jest dość ciężki. Bez modyfikacji prawdopodobnie nie będzie mógł on działać na sprzęcie konsumenckim, wskazuje TechCrunch.
Jednocześnie ranking LiveCodeBench – benchmark opracowany przez badaczy z UC Berkeley, MIT i Cornell – umieścił zaktualizowany model rozumowania R1 firmy DeepSeek tuż za modelami rozumowania o4 mini i o3 firmy OpenAI w zakresie generowania kodu, poinformował Reuters. A przed modelami Grok 3 mini firmy xAI i Qwen 3 od Alibaby.
Dodajmy, że oczekuje się, iż firma DeepSeek wypuści również R2, następcę R1. Powołując się na anonimowe źródła, Reuters poinformował w marcu, że wydanie R2 było pierwotnie planowane na maj br.