Zespół lingwistyki historycznej
Język zmienia się z upływem lat. W inny sposób posługiwano się nim 200 lat temu niż obecnie. Lingwistyka historyczna zajmuje się językiem naturalnym, uwzględniając kontekst czasu. Oprócz poszerzania wiedzy czysto lingwistycznej nasze badania dają nam wgląd w sposób, w jaki myśleli ludzie w przeszłości i w tematy, które były dla nich ważne. Poza tym mają charakter czysto praktyczny — pozwalają na budowanie lepszych modeli uczenia maszynowego. Przykładowo: znając odpowiednik słowa w przeszłości (np. samolot-aeroplan) można stworzyć lepszą wyszukiwarkę tekstów historycznych.
Badania tradycyjnie prowadzone są metodami językoznawstwa. Od niedawna na popularności zyskują metody uczenia maszynowego (w szczególności modele neuronowe). W naszym zespole łączymy oba podejścia, gdyż składamy się ze specjalistów zarówno lingwistyki, jak i informatyki.
Obecnie skupiamy się głównie na języku polskim oraz angielskim. Badamy przede wszystkim teksty pochodzące z czasopism datowanych od XIX wieku. Zajmujemy się także bardziej aktualnymi, krótszymi wycinkami czasu — kilku lub kilkunastu lat. Problemy, które rozwiązujemy to datowanie tekstów (podanie daty powstania lub publikacji tekstu), modelowanie językowe, wykrywanie i analiza fraz oraz trendów posługiwania się nimi na przestrzeni czasu lub w poszczególnych tekstów, jak i normalizacja diachroniczna.
Działamy jako cześć konsorcjum DARIAH-PL, które zajmuje się ogólnie pracą w zakresie humanistyki cyfrowej w Polsce.
Członkowie zespołu
mgr inż.
Kacper Dudzic
Magister informatyki i japonistyki naukowo zainteresowany badaniami na styku informatyki i językoznawstwa. Pracuje w obszarach lingwistyki komputerowej i przetwarzania języka naturalnego, obecnie nad zagadnieniami z zakresu humanistyki cyfrowej, tłumaczenia maszynowego i problematyki dużych modeli j
prof. dr hab.
Piotr Wierzchoń
Obszary naukowe: chronologizacja słownictwa polskiego XIX i XX w., leksykografia historyczna, automatyzacja przetwarzania języka naturalnego, leksykografia przekładowa, teoria dezinformacji, fotodokumentacja, uczenie maszynowe: klasyfikatory tekstu, rozpoznawanie obrazów, analizy szeregów czasowych
prof. dr hab.
Krzysztof Jassem
Dyrektor Centrum Sztucznej Inteligencji. Autor pracy doktorskiej z zakresu tłumaczenia automatycznego pt. "Elektroniczny system dwujęzyczny w automatycznym tłumaczenie tekstu" (1997), która zapoczątkowała rozwój tłumaczenia automatycznego w Polsce.
Konsultanci
dr
Marek Kubis
Dr Kubis prowadzi badania w zakresie systemów dialogowych i technik modelowania dyskursu. Jego zainteresowania obejmują metody geometrycznego uczenia głębokiego w zastosowaniu do przetwarzania języka naturalnego, techniki wzbogacania danych tekstowych oraz kompresję modeli neuronowych.
prof. UAM dr hab.
Filip Graliński
Zajmuje się przetwarzaniem tekstu i uczeniem maszynowym. Główne zainteresowania to modelowanie języka za pomocą sieci neuronowych, również z uwzględnieniem czasu i grafiki, przetwarzanie tekstów historycznych oraz ewaluacja systemów uczenia maszynowego. Autor systemów Gonito i GEval