26 lipca 2025 r.

Nowa wersja polskiego modelu językowego PLLuM już dostępna

PLLuM (ang. Polish Large Language Model) jest to stworzony na zlecenie Ministerstwa Cyfryzacji duży model językowy dostosowany do polskich realiów, rozumiejący polską gramatykę, kontekst społeczno-kulturowy i język urzędowy. W lipcu br. została przedstawiona uaktualniona i zoptymalizowana wersja modelu PLLuM-12B-nc-250715, lepiej przystosowana do takich zastosowań jak np. tworzenie oficjalnych e-maili czy wniosków.

PLLuM może również pomóc użytkownikom w m.in.

pisaniu tekstów,
nauce,
generowaniu treści do aplikacji,
tworzeniu konspektów np. planów podróży,
załatwianiu spraw urzędowych.

Czat dostępny jest bezpłatnie na stronie pllum.clarin-pl.eu. Na stronie można znaleźć również poradnik użytkownika, tzw. PromptBook, który zawiera przykładowe polecenia i tematy do wykorzystania w rozmowie z chatbotem.

Nowa wersja PLLuM została przygotowana z wykorzystaniem autorskiego zbioru danych o optymalnej jakości, bazującego na tekstach pochodzących z jednostek naukowych i publicznych repozytoriów np. z domeny gov.pl, Biuletynu Informacji Publicznej czy Biblioteki Nauki, a także od osób chętnych. Wszystkie dane treningowe pozyskiwane są z zachowaniem przepisów prawa krajowego i europejskiego.

Dzięki udostępnieniu do pobrania różnych wariantów modelu PLLuM, może on zostać dostosowany do potrzeb konkretnego użytkownika. Więcej informacji na temat dostępnych modeli można znaleźć na platformie HuggingFace Ministerstwa Cyfryzacji.

Najnowszy model PLLuM jest dostępny w trzech wariantach:

Base – wersja podstawowa, stanowiąca fundament kolejnych wersji modelu.
Instruct – wariant instrukcyjny, dostrojony do wykonywania zadań w j. polskim. Został nauczony odpowiadania na pytania i wykonywania poleceń. Może być stosowany do m.in. streszczania tekstów, tłumaczeń i pisania maili.
Chat – model konwersacyjny, gotowy do rozmowy z użytkownikiem. Najbardziej zaawansowana wersja, która została zaadaptowana językowo, dostrojona na instrukcjach, a także zabezpieczona i dostosowana do oczekiwań użytkowników.

Model PLLuM-12B-nc-250715 jest to pierwszy publicznie dostępny efekt prac konsorcjum HIVE AI, w skład którego wchodzą polskie ośrodki naukowe i instytucje działające w zakresie usług cyfrowych, którego pracami kieruje NASK PIB. Celem działań HIVE AI jest opracowywanie polskich modeli językowych oraz wdrażanie ich w jednostkach administracji publicznej.

Konsorcjum w najbliższym czasie planuje również zaprezentowanie kolejnych rezultatów i produktów projektu, w tym prototyp czatbota obywatelskiego, który będzie zbierał prompty w celu przyszłego wdrożenia modeli PLLuM w aplikacji mObywatel. Zapowiedziano również udostępnienie podzbiorów instrukcji i preferencji wraz ze szczegółową metodologią ich tworzenia, co jest szczególnie cenne dla badaczy i twórców modeli AI.

Polskie modele językowe, dzięki trenowaniu na polskich danych, są lepiej dostosowane do krajowego kontekstu kulturowego i generowania treści w języku polskim – lepiej radzą sobie z fleksją i stylem wypowiedzi niż modele zagraniczne, trenowane głównie na danych w języku angielskim. Tworzenie polskich modeli językowych jest również elementem wzmacniania suwerenności technologicznej oraz zapewnia większą niezależność i bezpieczeństwo, także w zakresie licencji i spełniania wymogów prawnych (krajowych i unijnych). Ich rozwój daje możliwość kontrolowania danych oraz pozwala na darmowe wykorzystanie powstających narzędzi. Rozwój polskich modeli AI daje także możliwość rozwoju krajowych kompetencji w zakresie sztucznej inteligencji.

Źródła:

nask.pl

gov.pl

naukawpolsce.pl