Sztuczna inteligencjaRynekPolecane tematy

Bielik.AI wdraża technologię DFlash i kilkukrotnie przyspiesza działanie swoich modeli

Fundacja SpeakLeash i Akademickie Centrum Komputerowe Cyfronet AGH zaprezentowały dwa nowe modele draftowe: Bielik-11B-v3.0-DFlash oraz Bielik-Minitron-7B-v3.0-DFlash. Rozwiązania te pozwalają znacząco skrócić czas generowania odpowiedzi, jednocześnie obniżając koszty infrastruktury i zachowując jakość wyników.

Bielik.AI wdraża technologię DFlash i kilkukrotnie przyspiesza działanie swoich modeli

Nowe modele wykorzystują technologię DFlash, zastosowaną po raz pierwszy w Polsce. To jedna z najnowszych metod tzw. dekodowania spekulatywnego (speculative decoding), która pozwala zwiększyć wydajność dużych modeli językowych bez pogorszenia jakości generowanych odpowiedzi.

„Stworzyliśmy rozwiązanie, które znacząco zwiększa przepustowość inferencji. Jest to szczególnie ważne dla firm rozwijających produkty AI obsługujące tysiące użytkowników jednocześnie. Dzięki wykorzystaniu nowych modeli draftowych przedsiębiorstwa mogą kilkukrotnie skrócić czas generowania odpowiedzi i jednocześnie obniżyć koszty infrastruktury” – skomentował Krzysztof Ociepa, Head of Model Training w Bielik.AI.

Podczas trenowania nowych modeli wykorzystano autorskie rozwiązania opracowane w frameworku ALLaMo, którego twórcą jest właśnie Krzysztof Ociepa.

Jak działa DFlash i dlaczego przyspiesza modele AI

Technologia DFlash opiera się na współpracy dwóch modeli. Lżejszy model draftowy generuje całe fragmenty odpowiedzi, które następnie są błyskawicznie weryfikowane przez większy model docelowy. Dzięki temu główny model nie musi tworzyć odpowiedzi od podstaw, co znacząco przyspiesza proces wnioskowania.

Modele draftowe zaprojektowano do współpracy z większymi modelami językowymi w środowiskach obsługujących DFlash, takich jak najnowsze wersje vLLM i SGLang. Nie są one przeznaczone do samodzielnego uruchamiania, lecz pełnią rolę akceleratorów zwiększających wydajność całego systemu.

Zdaniem twórców, publikacja modeli DFlash otwiera nowy etap rozwoju ekosystemu Bielik.AI i pokazuje, że innowacje związane z optymalizacją dużych modeli językowych powstają również poza największymi światowymi laboratoriami AI.

Nowe modele draftowe Bielika można pobrać w serwisie Hugging Face:

Strategicznymi partnerami Bielik.AI są EY oraz InPost. Wśród partnerów projektu znajdują się także Deviniti i Dell Technologies.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *