Sztuczna inteligencja Polecane tematy

Rząd udostępnia polski model językowy PLLuM

Adam Jadczak 24 lutego 2025

1 4 513 3 minut(y) czytania

Ministerstwo Cyfryzacji zaprezentowało polski model językowy PLLuM oraz plan jego rozwoju. Od dziś model dostępny jest dla każdego. PLLuM (Polish Large Language Model) to rodzina modeli sztucznej inteligencji, która pozwala przetwarzać i generować teksty w języku polskim.

Modele stworzone przez polskich ekspertów i ekspertki z dziedziny IT i lingwistyki, mają wesprzeć rozwój kompetencji cyfrowych oraz innowacje w administracji publicznej i biznesie. Członkami konsorcjum PLLuM są: Politechnika Wrocławska, NASK, Instytut Podstaw Matematyki PAN, Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, Uniwersytet Łódzki i Instytut Slawistyki Polskiej Akademii Nauk.

Projekt realizowany jest na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM.

Kolejne inwestycje w duże, polskie modele językowe LLM

Jednocześnie ogłoszono, że projekt PLLuM zostaje przekształcony w projekt HIVE zmierzający do budowy ekosystemu polskich modeli językowych. Zostanie też zwiększone finansowanie tego projektu. W 2024 roku na rozwój PLLuM przekazano 14,5 mln zł. W tym będzie to 19 mln zł. Liderem konsorcjum IVE zostaje Ośrodek Badań nad Bezpieczeństwem SI w NASK. Dołączają też do niego Centralny Ośrodek Informatyki oraz Akademickie Centrum Komputerowe Cyfronet AGH.

COI będzie wdrażać model, jako narzędzia dla urzędników i w mObywatelu. W aplikacji pojawi się wirtualny asystent, który ułatwi obywatelom korzystanie z usług administracji publicznej. Natomiast Cyfronet AGH będzie dostarczać mocy obliczeniowych pod uczenie modeli i ich udostępnianie. Cyfronet AGH dysponuje nowoczesną infrastrukturą obliczeniową w tym najszybszym superkomputerem w Polsce – Helios.

„PLLuM – wspólnie z modelem Bielik – mogą promować sztuczną inteligencję tworzoną w Polsce, wspierając się wzajemnie w lepszym procesie trenowania i dalszym pozyskiwaniu oraz otwieraniu danych, potrzebnych by AIMadeInPoland było coraz lepsze – dla administracji publicznej, biznesu i społeczeństwa” – mówią przedstawiciele resortu cyfryzacji.

Inwestycja w cyfrową suwerenność

„PLLuM to dowód na to, że możemy rozwijać nowoczesne technologie na własnych warunkach, w naszym języku, z korzyścią dla obywatelek i obywateli. Tworzymy fundament pod inteligentne usługi publiczne i innowacje, które będą realnym wsparciem zarówno dla administracji, jak i biznesu” – mówi Krzysztof Gawkowski, wicepremier i minister cyfryzacji.

Polski model językowy, a właściwie na dziś 18 modeli, wykorzystuje od 8 do 70 mld parametrów. Pozwala na precyzyjne generowanie treści w języku polskim. „Mniejsze wersje dobrze sprawdzają się w szybkich zadaniach, podczas gdy większe oferują wyższą precyzję i kontekstową spójność w rozumieniu języka polskiego. W rodzinie modeli PLLuM znajdują się m.in. modele w architekturze Mixture of Experts ze zrównoważonym wyborem ekspertów oraz wyspecjalizowane modele Retrieval Augmented Generation” – wyjaśniają autorzy projektu.

Konsorcjum PLLuM podkreśla etyczny sposób pozyskiwania danych. Wersje do użytku komercyjnego wykorzystują zasoby tekstowe od właścicieli, którzy udzielili licencji konsorcjum (także ITwiz), a także zasoby, które, zgodnie z ustawą o prawie autorskim i prawach pokrewnych oraz przepisami UE, mogą być wykorzystane do budowy w pełni otwartego modelu.

Modele naukowe (tj. udostępniane na licencjach, które nie pozwalają na zastosowania komercyjne) korzystają także z ogólnodostępnych zbiorów danych, takich jak Common Crawl.

Trenowanie i rozwój modeli PLLuM

Dostrajany na autorskich zbiorach danych, czyli dziesiątkach tysięcy tzw. instrukcji – pobudzeń (promptów) i oczekiwanych odpowiedzi modelu – oraz preferencji – pobudzeń i różnych odpowiedzi modeli ocenionych pod kątem jakościowym – tworzonych przez zespół ponad 50 specjalistów i specjalistek.

„Rozwój PLLuM to inwestycja w cyfrowe państwo. Do tej pory przeznaczyliśmy na ten projekt 14,5 mln zł, a teraz idziemy krok dalej – kolejne 19 mln zł pozwoli na wdrożenie modelu w administracji publicznej i rozszerzenie współpracy o nowych partnerów, takich jak COI i Cyfronet. Dzięki temu PLLuM stanie się kluczowym elementem cyfryzacji usług publicznych i rozwoju krajowego ekosystemu AI” – powiedział Dariusz Standerski, wiceminister cyfryzacji.

PLLuM wyróżnia się na tle innych modeli językowych. Jest dostosowany do specyfiki języka polskiego oraz terminologii administracji publicznej. W procesie jego tworzenia stosuje kompleksowe procedury gromadzenia danych i oceny ich jakości. PLLuM przede wszystkim korzysta z danych organicznych – opracowywanych ręcznie, a nie przy użyciu innych modeli językowych. Trenowany na polskich zasobach, bardzo dobrze radzi sobie z wyzwaniami fleksji i złożonej składni generując precyzyjne treści.

Konkretne zastosowania polskich LLM-ów

PLLuM dostarczy zaawansowanych rozwiązań dla administracji publicznej i tym samym wesprze dalszą cyfryzację Polski:

Wirtualny asystent w mObywatel, który wesprze obywateli i obywatelki w uzyskiwaniu informacji publicznych.
Inteligentny asystent urzędniczy, który zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i wsparcie w udzielaniu odpowiedzi na pytania obywateli i obywatelek.
Edukacja, ułatwi rozwój aplikacji edukacyjnych, tłumaczeń i pomoc nauczycielom i nauczycielkom w prowadzeniu angażujących lekcji z użyciem najnowszych technologii.

„Rozwój PLLuM to także szansa na wzmocnienie konkurencyjności Polski w sektorze IT i całej gospodarce. Inwestycje w sztuczną inteligencję przyczyniają się do powstawania nowych firm i produktów opartych na AI, napędzając wzrost gospodarczy. Wykorzystanie PLLuM w różnych obszarach – od edukacji i administracji po sektor prywatny – sprzyja tworzeniu nowoczesnych rozwiązań, które umacniają pozycję Polski wśród liderów rozwoju AI” – przekonują przedstawiciele Ministerstwa Cyfryzacji.

PLLuM jest dostępny na stronie konsorcjum.

Modele PLLuM można pobrać na Hugging Face.

Test modeli LLM w zakresie kompetencji językowych i kulturowych w języku polskim

Model	Dostawca	średnia (6 kategorii)	sztuka i rozrywka	kultira i tradycja	geografia	gramatyka	historia	słownictwo
O1-2024-12-17	OpenAI	89.17	86	92	95	84	90	88
Gemini-Exp-1206	Google	83.00	83	90	86	69	88	82
Claude-3.5-Sonnet-20241022	Anthropic	82.67	77	87	85	79	91	77
GPT-4o-2024-05-13	OpenAI	82.33	83	92	89	70	82	78
Claude-3.7-Sonnet	Anthropic	81.50	80	83	87	74	90	75
GPT-4o-2024-08-06	OpenAI	81.33	82	89	88	66	86	77
GPT-4o-2024-11-20	OpenAI	81.33	82	89	86	67	84	80
Claude-3.5-Sonnet-20240620	Anthropic	80.67	73	85	86	75	89	76
DeepSeek-R1	DeepSeek	76.00	66	75	84	74	85	72
Gemini-2.0-Flash-Thinking-Exp-01-21	Google	74.83	72	76	84	68	80	69
Gemini-2.0-Flash-Experimental	Google	74.17	68	78	79	65	83	72
Claude-3-Opus	Anthropic	73.83	73	76	80	66	86	62
Gemini-Pro-1.5	Google	69.67	62	77	74	58	79	68
DeepSeek-v3	DeepSeek	69.17	61	73	79	62	77	63
PLLuM-8x7B-nc-chat	PLLuM	68.17	72	76	73	47	73	68
GPT-4-turbo	OpenAI	67.00	61	74	79	56	76	56
Grok-2-1212	xAI	66.00	57	67	77	64	74	57
Llama-3.1-Tulu-3-405B	Meta	63.83	64	64	71	56	75	53
Bielik-2.2	SpeakLeash	63.00	54	60	72	53	77	62
Bielik-2.3	SpeakLeash	62.17	58	61	68	49	76	61
Bielik-2.1	SpeakLeash	61.00	55	64	68	50	73	56
Llama-3.1-405b	Meta	60.00	56	57	74	57	73	43
GPT-4	OpenAI	59.50	49	63	67	58	72	48
PLLuM-12B-nc-chat	PLLuM	59.50	59	65	70	41	70	52
O3-mini-2025-01-31	OpenAI	59.33	46	51	78	67	67	47
Claude-3.5-Haiku-20241022	Anthropic	57.83	43	62	72	57	61	52
GPT-4o-mini-2024-07-18	OpenAI	56.83	42	57	69	55	67	51
Claude-3.0-Sonnet	Anthropic	56.50	46	53	65	56	73	46
Mistral-Large-2407	Mistral	54.17	48	52	63	51	71	40
Mistral-Large-2411	Mistral	52.00	39	52	61	54	64	42
O1-mini-2024-09-12	OpenAI	51.67	38	44	66	61	61	40
WizardLM-2-8x22b	Microsoft	51.50	45	50	60	49	67	38
Qwen-Max	Alibaba	50.83	43	50	53	51	63	45
Command-R-Plus-08-2024	Cohere	50.17	44	49	61	43	61	43
Mixtral-8x22b	Mistral	49.83	45	41	59	50	69	35
Command-R-Plus-04-2024	Cohere	49.33	39	52	53	45	61	46
Llama-3.3-70B	Meta	48.83	43	40	59	49	65	37
Llama-3.1-70B	Meta	47.83	42	41	58	44	68	34
Bielik-0.1	SpeakLeash	46.67	43	52	61	29	58	37
Gemini-Flash-1.5	Google	46.50	33	41	61	46	51	47
GPT-3.5-turbo	OpenAI	43.33	39	38	55	41	51	36
Llama-3.0-70B	Meta	43.00	40	38	49	45	64	22
Gemma-2-27b	Google	42.67	32	41	47	46	53	37
Qwen-2.5-72b	Alibaba	39.17	25	30	45	45	54	36
Mistral-Small-24B-2501	Mistral	39.00	33	29	42	45	49	36
Qwen-Plus	Alibaba	38.50	26	32	42	47	46	38
Mixtral-8x7b	Mistral	35.33	31	27	44	34	56	20
Gemma-2-9b	Google	29.17	19	23	30	38	35	30
Phi-4	Microsoft	29.17	23	17	35	34	40	26
Qwen-Turbo-2024-11-01	Alibaba	28.50	15	20	30	33	42	31
Mistral-Nemo	Mistral	23.00	20	13	26	31	28	20
Command-R7B	Cohere	22.83	14	18	33	23	27	22
Llama-3.1-8B	Meta	22.67	19	13	31	29	25	19
Mistral-7b-v0.3	Mistral	21.83	22	9	27	27	30	16
Ministral-8b	Mistral	20.67	14	12	19	24	33	22
Qwen-2.5-7b	Alibaba	17.67	5	11	17	29	23	21