W porównaniu do poprzednich wersji modelu, Bielika v2 znacząco ulepszono - zarówno pod kątem technicznym, jak i funkcjonalnym. Jakie są jego główne atuty? Nowa wersja Bielika posiada 11 miliardów parametrów. Oznacza to, że model lepiej rozumie kontekst i generuje bardziej złożone, precyzyjne oraz naturalne odpowiedzi. „Bielik, jako wyspecjalizowany polski model, jest w stanie obsłużyć wiele zadań w języku polskim porównywalnie (a często nawet lepiej) niż modele dużo większe. Widać to między innymi w ocenie społeczności w spichlerzowej Chat Arenie - najnowszy Bielik, mając 11B parametrów, plasuje się w rankingu wyżej niż Llama-3.1 mająca ich aż 405B” - czytamy we wpisie twórców projektu, społeczności SpeakLeash.org, na portalu LinkedIn. Więcej danych, większe okno kontekstowe Wersję 2 zoptymalizowano właśnie pod kątem lepszej jakości odpowiedzi. Wykorzystano w niej kilkukrotnie większy korpus danych o wysokiej jakości. Udoskonalono także algorytmy, które pozwalają na dokładniejsze rozpoznawanie intencji użytkownika. To przekłada się na większą trafność i użyteczność generowanych treści. Nowy Bielik jest nie tylko bardziej precyzyjny, ale także szybszy. Jak zapewniają przedstawiciele SpeakLeash.org, zoptymalizowane procesy przetwarzania danych oraz lepsze zarządzanie zasobami sprawiają, że model jest w stanie obsłużyć większą ilość zapytań w krótszym czasie. Okno kontekstowe nowej wersji zwiększono do ponad 32 tys. tokenów. Według informacji specjalistów odpowiadających za projekt, Bielik v2 nie tylko poradzi sobie z sumaryzacją tekstu, strukturyzacją wyekstrahowanych danych czy napisaniem opowiadania. Jest wszechstronnym narzędziem, które sprawdzi się także przy tworzeniu obiektów JSON czy pisaniu dokumentacji na bazie kodu. Jednym z najważniejszych atutów Bielika v2 jest oczywiście jego dostępność. Używanie tego zaawansowanego modelu nie wymaga bowiem licencji - udostępniono go za darmo. Podobnie jak jego poprzednik, Bielik v2 dostępny jest na platformie HugginFace. Znajduje się tam dokumentacja w jaki sposób skorzystać z biblioteki transformers w Pythonie, aby uruchomić Bielika. Szansa dla polskich firm Bezpłatny dostęp do Bielika v2 otwiera nowe możliwości przed polskimi firmami. Zwłaszcza tymi, które dopiero rozpoczynają swoją działalność i nie dysponują dużymi budżetami na zaawansowane technologie. Jak zapewniają przedstawiciele SpeakLeash.org, rozwiązanie to może wspierać organizacje z różnych sektorów - od e-commerce, przez usługi finansowe, po media i marketing. „Bielika można z łatwością zintegrować z istniejącą infrastrukturą firmy. Jest dostosowany do polskich realiów, bazując na ogromnych zasobach lokalnych danych, co daje mu znaczącą przewagę nad globalnymi rozwiązaniami” - podkreślają twórcy projektu. „Dostosowanie modelu do lokalnych uwarunkowań językowych i kulturowych sprawia, że Bielik lepiej rozumie specyfikę polskiego języka i jego niuanse. To kluczowa cecha dla firm, które muszą skutecznie komunikować się z klientami na lokalnym rynku” - dodają. Bielik jest modelem hostowanym lokalnie. Fakt ten dobrze wpisuje się w wymagania dotyczące bezpieczeństwa i prywatności danych. Minimalizuje także ryzyko nieautoryzowanego dostępu. Nową wersję modelu trenowano na superkomputerze Helios - najpotężniejszej maszynie klasy HPC w Polsce - dzięki uprzejmości Akademickiego Centrum Komputerowego Cyfronet AGH.