Sztuczna inteligencjaPolecane tematy
SpeakLeash zaproponował nowe modele Bielik 11B v2.5 i dwa lekkie modele 3.0
Podczas pierwszego dnia międzynarodowej konferencji GOSIM AI Paris, społeczność SpeakLeash ogłosiła premierę nowej rodziny otwartych modeli językowych Bielik 3.0 – 1.5B, Bielik 3.0 – 4.5B i Bielik 2.5 – 11B.
To przełomowy moment dla projektu, który od początku łączy ducha open science z profesjonalną infrastrukturą superkomputerową Akademickiego Centrum Komputerowego Cyfronet AGH.
Właśnie ta synergia – otwartej społeczności inżynierów i badaczy z najwyższej klasy zapleczem obliczeniowym – pozwoliła stworzyć rodzinę modeli AI, które są nie tylko dostępne w modelu open source, ale też praktyczne i gotowe do realnego wdrożenia.
Nowe modele oferują:
- polski, dedykowany tokenizer,
- Tool Use – możliwość wywoływania zewnętrznych narzędzi,
- Structured Output – odpowiedzi gotowe do automatycznego przetwarzania,
- gotowość do działania jako agenci AI tzw. Agent Readiness.
„Tool use i zalążek modelu wnioskującego to bardzo ważny element w rozwoju Bielika. Dzięki temu oraz możliwościom uruchomienia modeli na dowolnej, nawet niewielkiej infrastrukturze, Agent Readiness staje się faktem. Co więcej, małe modele można łatwo dostroić – dlatego agent do zadań specjalnych może być dziś dostępny dla każdego” – podkreśla Remigiusz Kinas, szef działu R&D projektu Bielik.
Modele 3.0 bazują na architekturze Qwen 2.5 i zostały wyposażone w nowy tokenizer. Mechanizm ten dzieli tekst na jednostki zrozumiałe dla modelu (np. słowa, frazy lub ich fragmenty). Został on zoptymalizowany specjalnie pod język polski. Przekłada się to na szybsze i trafniejsze generowanie wypowiedzi
Z kolei Bielik 2.5 – 11B, oparty na architekturze Mistral – obsługuje formaty strukturalne (np. JSON), potrafi wnioskować (choć na razie w fazie eksperymentalnej) i współpracuje z zewnętrznymi narzędziami, a wszystko to w pełni otwarcie i dostępnie.
„W małych modelach wymieniliśmy tokenizer i wypróbowaliśmy zupełnie nową architekturę, natomiast w wersji v2.5 dodaliśmy eksperymentalnie elementy modelu wnioskującego. Chcemy zebrać mocny feedback i zaproponować już za chwilę całkowicie nową wersję Bielika” – opowiada Krzysztof Ociepa, lider zespołu trenującego modele Bielik.
Premiera odbywa się w ramach konferencji GOSIM AI Paris – wydarzenia promującego globalne innowacje open source w AI. „Obecność Bielika w programie to nie tylko wyróżnienie, ale i dowód na to, że polskie inicjatywy mogą konkurować na europejskim poziomie” – mówi Sebastian Kondracki, prezes i założyciel fundacji SpeakLeash i współtwórca Bielika.AI.
„Skoro jesteśmy w Paryżu i mamy okazję uczyć się od największych przedstawicieli otwartych projektów, takich jak PyTorch, Linux Foundation, vLLM, sglang, llama.cpp, jan.ai i wielu innych, to właśnie stąd ogłosimy premiery naszych nowych modeli. Chcemy pokazać, że dążymy do tego, by stać się globalnym i rozpoznawalnym europejskim projektem open source” – dodaje.
Wyjazd oraz premiera modeli Bielik odbywają się pod honorowym patronatem Ministerstwa Cyfryzacji. Lot Bielika do Paryża wsparli także Polski Fundusz Rozwoju, Credit Agricole Bank Polska, Deviniti, Google Cloud Poland, PZU. To dzięki nim społeczność mogła zaprezentować się na europejskiej scenie i ogłosić nowy rozdział w historii polskiego AI.
Przypomnijmy, Bielik to otwarty model językowy stworzony przez społeczność SpeakLeash we współpracy z Cyfronet AGH. Trening modeli odbywał się na superkomputerach Helios i Athena, z użyciem wyłącznie danych na wolnych licencjach (m.in. od ITwiz) i z naciskiem na jakość języka polskiego.
Modele Bielika publikowane są na licencji Apache 2.0, co oznacza pełną otwartość – także komercyjną.