25 października 2024 r. na Wydziale Matematyki i Informatyki Uniwersytetu im. Adama Mickiewicza w Poznaniu odbyły się warsztaty poświęcone ewaluacji modeli językowych i zasobów potrzebnych do ich tworzenia. Wydarzenie zgromadziło przedstawicieli Konsorcjum PLLuM, Centrum Sztucznej Inteligencji UAM, DomData, Wydawnictwa Naukowego PWN oraz Snowflake.
Dzień rozpoczął się od prezentacji zasobów i projektów opracowanych przez pracowników i studentów UAM, które przedstawił Krzysztof Jassem, Piotr Jabłoński oraz Marek Kubis. Następnie reprezentanci konsorcjum PLLuM omówili proces budowy polskiego modelu językowego, który stanowi ważny wkład w rozwój technologii językowych w Polsce. Konsorcjum reprezentowane było, m. in. przez: Maciej Piasecki, Jan Kocoń, Agnieszka Karlińska, Grzegorz Chodak, Marek Kozłowski, PhD , Maciej Ogrodniczuk, Piotr Pezik, Paweł Walkowiak, Aleksandra Tomaszewska.
Polskie modele językowe, będące wielkimi modelami językowymi (ang. Large Language Models, LLM), to zaawansowane systemy sztucznej inteligencji zdolne do rozumienia i generowania języka. Trening takich modeli wymaga olbrzymiej mocy obliczeniowej i dostępu do ogromnych zbiorów danych językowych. Modele te są obecnie w stanie wspierać szerokie spektrum zastosowań: od automatyzacji obsługi klienta i tłumaczeń po badania naukowe i edukację.
W Polsce pracuje się nad kilkoma zaawansowanymi modelami LLM, które mają wspierać dokładne rozumienie i generowanie języka polskiego. Konsorcjum PLLuM oraz organizacja SpeakLeash (model Bielik) intensywnie rozwijają technologie, które mają dostosować te modele do polskiego kontekstu, zapewniając, że będą one bardziej precyzyjnie odzwierciedlać niuanse języka i kultury. Dzięki tym wysiłkom polskie LLM-y będą mogły sprostać wyzwaniom specyficznym dla naszego rynku i wspierać rozwój technologii opartych na sztucznej inteligencji.
W dalszej części dnia Filip Graliński z Snowflake zaprezentował nowoczesne narzędzia wspierające trenowanie modeli AI, które umożliwiają bardziej efektywną i skalowalną pracę z danymi. Na koniec dnia odbyła się dyskusja Round Table, podczas której przedstawiciele różnych branż, w tym DomData i Wydawnictwo Naukowe PWN, wymieniali się poglądami na temat przyszłości i rozwoju kompetencji w obszarze sztucznej inteligencji. Dyskusja skupiała się również na transferze wiedzy i kompetencji do gospodarki oraz na edukacji kolejnych pokoleń studentów.
Dziękujemy wszystkim uczestnikom za inspirujące rozmowy i zaangażowanie.