Sztuczna inteligencjaRynek

Nowy model DeepSeek R1-0528 trafił na Hugging Face

Chiński startup DeepSeek opublikował aktualizację swojego flagowego modelu rozumowania. R1-0528 trafił na platformę deweloperską Hugging Face, ale nie opublikowano jeszcze oficjalnego ogłoszenia publicznego, opisu modelu ani porównań. Czy nowy R1 znów stanie się realną konkurencją dla amerykańskich modeli od OpenAI?

Nowy model DeepSeek R1-0528 trafił na Hugging Face

Repozytorium Hugging Face nie zawiera opisu chińskiego modelu – tylko pliki konfiguracyjne i wagi, wewnętrzne komponenty modelu, które kierują jego zachowaniem. Zaktualizowany R1, ważący 685 miliardów parametrów,  jest dość ciężki. Bez modyfikacji prawdopodobnie nie będzie mógł on działać na sprzęcie konsumenckim, wskazuje TechCrunch.

Jednocześnie ranking LiveCodeBench – benchmark opracowany przez badaczy z UC Berkeley, MIT i Cornell – umieścił  zaktualizowany model rozumowania R1 firmy DeepSeek tuż za modelami rozumowania o4 mini i o3 firmy OpenAI w zakresie generowania kodu, poinformował Reuters. A przed modelami Grok 3 mini firmy xAI i Qwen 3 od Alibaby.

Dodajmy, że oczekuje się, iż firma DeepSeek wypuści również R2, następcę R1. Powołując się na anonimowe źródła, Reuters poinformował w marcu, że ​​wydanie R2 było pierwotnie planowane na maj br.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *