Co najmniej od jesieni trwają prace nad wdrożeniem polskiego modelu językowego PLLuM w administracji rządowej. O rozpoczynających się testach słyszeliśmy w październiku od przedstawicieli Centralnego Ośrodka Informatyki. W połowie grudnia już oficjalnie mówił o nich Dariusz Standerski, wiceminister cyfryzacji. Mimo to do dziś nie ma umowy, by gotowe rozwiązania wdrożyć.
PLLuM ma dawać lepszej jakości wyniki
PLLuM to projekt tworzony przez Politechnikę Wrocławską, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, NASK, Ośrodek Przetwarzania Informacji oraz Uniwersytet Łódzki. Jego celem było stworzenie polskiego modelu językowego – takiego systemu sztucznej inteligencji, który potrafiłby przetwarzać i generować tekst w sposób przypominający ludzki.
Praca badaczy miała doprowadzić do tego, że dla języka polskiego PLLuM będzie dawał lepszej jakości wyniki niż zagraniczne odpowiedniki, takie jak np. ChatGPT. W dodatku będzie to robić taniej. A dzięki temu, że właścicielem wyników jest Ministerstwo Cyfryzacji, Polska może też zachować nad modelem pełną kontrolę. To gwarancja, że prywatna firma nagle nie wyłączy usługi ważnej dla funkcjonowania państwa. Założeniem prac nad PLLuM od początku było też to, by model był zgodny z prawem – tzn., by do jego stworzenia zostały użyte tylko legalnie pozyskane dane (umowę licencyjną na wykorzystanie treści podpisano np. z Agorą). To także jego przewaga. Dla przykładu: firma OpenAI ma dziś procesy sądowe z wydawcami prasy za to, że bezprawnie wykorzystywała ich artykuły do trenowania sztucznej inteligencji.
Naukowcy wywiązali się z umowy. A ministerstwo cyfryzacji?
Prace nad PLLuM trwały 11 miesięcy – decyzja o przyznaniu dotacji zapadła krótko przed październikowymi wyborami. Po zmianie władzy minister Krzysztof Gawkowski co prawda wymienił odpowiedzialną za projekt po stronie MC Inez Okulską, która równolegle pracowała jako szefowa departamentu innowacji w resorcie oraz kierowniczka zakładu inżynierii lingwistycznej i analizy tekstu NASK, ale PLLuM był nadal realizowany. Badacze otrzymali na niego pieniądze pod koniec stycznia 2024 r., dotacja udzielona przez MC wyniosła ponad 14 mln zł.
Koniec prac nad PLLuM był z góry przewidziany na grudzień. Naukowcy wywiązali się z umowy i dostarczyli model, a MC rozpoczęło nawet testy z urzędnikami (wg. informacji przekazanych przez wiceministra Dariusza Standerskiego na antenie Polskiego Radia RDC używa go ok. 400 osób w samym resorcie). Mimo to do dziś nie ma umowy na następny krok, czyli wdrożenie w całej administracji. – Proces uzgadniania jest złożony – słyszymy, kiedy w resorcie cyfryzacji pytamy o jego los.
Nowi w zespole, czyli dlaczego tak długo
Jak się dowiedział DGP, w tym roku do konsorcjum PLLuM ma dołączyć Centralny Ośrodek Informatyki. Będzie odpowiedzialny za wdrożenie modelu jako narzędzia dla urzędników, a także w aplikacji mObywatel. Ma się tam znaleźć wirtualny asystent.
Już w marcu w rozmowie z DGP takie plany przedstawiał nowy szef COI – Radosław Maćkiewicz. Mówił jednak o planach wdrożenia wirtualnego asystenta na podstawie rozwiązań firmy OpenAI. O współpracy z NASK i modelu PLLuM nie było mowy.
Z kolei infrastrukturę obliczeniową, poza wrocławskim ośrodkiem (realizującym projekt CLARIN), ma dostarczyć krakowska Akademia Górniczo-Hutnicza, gdzie działa najsilniejszy polski superkomputer Helios. Z końcem ub.r. AGH dostała na rozwój projektu rządową dotację w wysokości ok. 70 mln zł.
Według przedstawicieli resortu to przez rozszerzenie partnerstwa przeciąga się przyznanie kolejnej dotacji. Jak przyznaje Marek Gieorgica, dyrektor biura komunikacji MC, prace nad porozumieniem mogą zająć jeszcze kilka tygodni.
– W ramach projektu będą także gromadzone i wytwarzane nowe zbiory danych językowych, które pozwolą na lepsze dopasowanie modeli do wymagań sektora publicznego oraz na ich gruntowne zabezpieczenie – zapewnia.
Model językowy będzie się rozwijać
Prace nad samym polskim modelem językowym trwają jednak bez przerwy. Naukowcy będą go rozwijać niezależnie od tego, kiedy MC przyszykuje pieniądze na wdrożenie rozwiązania w administracji.
Wrocławskie konsorcjum CLARIN-PL, którym zarządza prof. Maciej Piasecki, równolegle lider projektu PLLuM, uzyskało z funduszy europejskich nowy projekt pod nazwą CLARIN-PL-Biz. W jego ramach ma być rozwijanych wiele technologii opartych na generatywnych modelach językowych.
To możliwe dzięki temu, że PLLuM ma być modelem otwartym, udostępnionym również dla badaczy i biznesu. Trwają ustalenia z MC na temat sposobu jego publikacji. ©℗
Edytowano 9.01.2025, 16:03. Usunięto zdanie: "Dziś wiadomo, że NASK będzie czuwać nad całym projektem wdrożeniowym". Według informacji przekazanych przez MC, nad wdrożeniem będzie czuwać COI. Za pomyłkę przepraszamy.