NASK opublikował nowy wariant polskiego modelu sztucznej inteligencji PLLuM

fot: pixabay.com

AI podbija polskie firmy

fot: pixabay.com

Opublikowany w środę nowy wariant PLLuM został wytrenowany na większym zbiorze danych, dostrojony do nowych zadań, m.in. urzędowych oraz lepiej zabezpieczony przed atakami - przekazał Instytut NASK w komunikacie. Zaktualizowany polski model został udostępniony w trzech wersjach.

Jak wskazał NASK-PIB, nowy wariant polskiego modelu AI, czyli PLLuM-12B-nc-250715 został wytrenowany na “znacznie lepiej“ przygotowanym i większym zbiorze danych; został też dostrojony do nowych zadań, w tym zadań urzędowych.

Model trenowany był m.in. na tekstach z domeny gov. pl, Biuletynu Informacji Publicznej oraz z Biblioteki Nauki. - Dane gromadzone są w sposób w pełni zgodny z prawem polskim i europejskim - podkreśliła w komunikacie dr Agnieszka Karlińska z Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK.

Jak podano, zaktualizowany PLLuM dostępny jest w trzech wariantach: bazowym, instrukcyjnym, czyli dostosowanym do realizacji szeregu zadań oraz “wychowanym“, czyli zabezpieczonym przed nadużyciami. Ta ostania wersja, jest “najbardziej zaawansowana“ - podkreślił instytut NASK. Oparto ją na zbiorach promptów (zapytań) oraz odpowiedzi ocenianych przez ludzi jako lepsze lub gorsze, co pomaga jej reagować bardziej precyzyjnie i bezpiecznie podczas rozmów.

Modele z tej serii są dostępne na platformie Hugging Face, skąd, po wypełnieniu formularza, może je pobrać każdy użytkownik - dodano.

- Od początku staliśmy na stanowisku, że masowe kopiowanie gotowych modeli AI, tzw. silnych LLM-ów wiąże się z szeregiem zagrożeń. Dlatego wypracowujemy metodologię kontrolowanego generowania danych syntetycznych, czyli takich, które powstają z udziałem innych modeli, ale są sprawdzane i zatwierdzane przez ludzi - wskazał dr hab. Piotr Pęzik, prof. Uniwersytetu Łódzkiego, kierownik operacyjny projektu HIVE AI, odpowiedzialnego za polski model.

Dzięki temu PLLuM lepiej rozumie polski kontekst kulturowy i odpowiada precyzyjniej, a także generuje mniej zbędnych i przypadkowych słów - wyjaśniono.

Model został też dodatkowo zabezpieczony przed atakami - zapewniono. Testy podatności pokazały, że skuteczność ataków promptowych udało się zmniejszyć do 2-3 przypadków na 100 prób. To znacznie mniej niż w przypadku innych otwartych modeli - zaznaczył NASK. Ataki promoptowe (z ang. prmompt injcetion) to technika, w której atakujący kieruje “złośliwe“ instrukcje, obchodząc zabezpieczenia modele, wskutek czego może dojść np. do generowania szkodliwych odpowiedzi, czy ujawniania poufnych informacji.

Dr Karlińska zapowiedziała, że konsorcjum HIVE “już wkrótce“ zaprezentuje drugi produkt z rodziny PLLuM - prototyp asystenta (czatbota) obywatelskiego, który posłuży badaczom do zbierania promptów pod kątem wdrożenia modeli PLLuM w aplikacji mObywatel.

NASK podała, że kolejne premiery konsorcjum HIVE AI zostaną ogłoszone w najbliższych tygodniach.

PLLuM to model językowy stworzony dla administracji, firm i naukowców, a także dla obywateli - w formie czatbotu. Miał on swoją premierę pod koniec lutego br. Ministerstwo Cyfryzacji ogłosiło wtedy powołanie HIVE AI, czyli konsorcjum polskich ośrodków naukowych oraz instytucji skupionych wokół usług cyfrowych, na czele którego stoi NASK-PIB. Konsorcjum opracowuje nowe polskojęzyczne modele językowe PLLuM i wdraża je w jednostkach administracji publicznej. 

MOŻE CIĘ ZAINTERESOWAĆ

Firmy z USA gotowe inwestować w Polsce w fabrykę paliwa do SMR i komponenty dla satelitów

Amerykańska spółka X-Energy deklaruje gotowość do zainwestowania w Polsce blisko 1 mld dolarów w ramach Zielonego Okręgu Przemysłowego Kaszubia. Z kolei Quantum Space rozważa produkcję w Polsce komponentów do satelitów oraz systemów służących ochronie i bezpieczeństwu infrastruktury satelitarnej w przestrzeni kosmicznej.

ORLEN stworzy sieć „komfortek” dla podróżujących ze szczególnymi potrzebami

ORLEN jako pierwsza firma paliwowa w Polsce uruchamia program, który ma zwiększyć komfort podróżowania po kraju osób ze szczególnymi potrzebami. Przy najważniejszych trasach powstanie ponad 30 tzw. „komfortek” – specjalistycznych pomieszczeń higieniczno-opiekuńczych.

Trójkąt Transformacji. Co po fedrowaniu? Cyfrowy i bezpieczny Śląsk

W Katowicach wiele razy mówiono, że transformacja Śląska powinna być sprawiedliwa, zrównoważona, nowoczesna, zielona, ambitna i innowacyjna. Prof. Artur Dyczko, dyrektor Oddziału Górnośląskiego PIG-PIB, dopisał do tej listy słowo: bezpieczna. Jego wystąpienie pokazało wizję Cyfrowego i Bezpiecznego Śląska - regionu, który dzięki danym, mapom, modelom, monitoringowi i cyberodporności będzie potrafił nie tylko przechodzić transformację, ale także ją rozumieć, monitorować i zabezpieczać.

Na koniec maja br. zasoby złota wzrosły do 613,9 ton

W rezerwach Narodowego Banku Polskiego na koniec maja było niemal 613,9 ton złota - poinformował w piątek bank centralny. To wzrost o ponad 18 ton wobec poprzedniego miesiąca.