Zespół lingwistyki historycznej

Język zmienia się z upływem lat. W inny sposób posługiwano się nim 200 lat temu niż obecnie. Lingwistyka historyczna zajmuje się językiem naturalnym, uwzględniając kontekst czasu. Oprócz poszerzania wiedzy czysto lingwistycznej nasze badania dają nam wgląd w sposób, w jaki myśleli ludzie w przeszłości i w tematy, które były dla nich ważne. Poza tym mają charakter czysto praktyczny — pozwalają na budowanie lepszych modeli uczenia maszynowego. Przykładowo: znając odpowiednik słowa w przeszłości (np. samolot-aeroplan) można stworzyć lepszą wyszukiwarkę tekstów historycznych.
Badania tradycyjnie prowadzone są metodami językoznawstwa. Od niedawna na popularności zyskują metody uczenia maszynowego (w szczególności modele neuronowe). W naszym zespole łączymy oba podejścia, gdyż składamy się ze specjalistów zarówno lingwistyki, jak i informatyki.
Obecnie skupiamy się głównie na języku polskim oraz angielskim. Badamy przede wszystkim teksty pochodzące z czasopism datowanych od XIX wieku. Zajmujemy się także bardziej aktualnymi, krótszymi wycinkami czasu — kilku lub kilkunastu lat. Problemy, które rozwiązujemy to datowanie tekstów (podanie daty powstania lub publikacji tekstu), modelowanie językowe, wykrywanie i analiza fraz oraz trendów posługiwania się nimi na przestrzeni czasu lub w poszczególnych tekstów, jak i normalizacja diachroniczna.



Działamy jako cześć konsorcjum DARIAH-PL, które zajmuje się ogólnie pracą w zakresie humanistyki cyfrowej w Polsce.

Członkowie zespołu

mgr inż.

Kacper Dudzic

Magister informatyki i japonistyki naukowo zainteresowany badaniami na styku informatyki i językoznawstwa. Pracuje w obszarach lingwistyki komputerowej i przetwarzania języka naturalnego, obecnie nad zagadnieniami z zakresu humanistyki cyfrowej, tłumaczenia maszynowego i problematyki dużych modeli j
Piotr Wierzchoń

prof. dr hab.

Piotr Wierzchoń

Obszary naukowe: chronologizacja słownictwa polskiego XIX i XX w., leksykografia historyczna, automatyzacja przetwarzania języka naturalnego, leksykografia przekładowa, teoria dezinformacji, fotodokumentacja, uczenie maszynowe: klasyfikatory tekstu, rozpoznawanie obrazów, analizy szeregów czasowych
Zdjęcie przedstawiające profesora Krzysztofa Jassema

prof. dr hab.

Krzysztof Jassem

Dyrektor Centrum Sztucznej Inteligencji. Autor pracy doktorskiej z zakresu tłumaczenia automatycznego pt. "Elektroniczny system dwujęzyczny w automatycznym tłumaczenie tekstu" (1997), która zapoczątkowała rozwój tłumaczenia automatycznego w Polsce.

Konsultanci

dr

Marek Kubis

Dr Kubis prowadzi badania w zakresie systemów dialogowych i technik modelowania dyskursu. Jego zainteresowania obejmują metody geometrycznego uczenia głębokiego w zastosowaniu do przetwarzania języka naturalnego, techniki wzbogacania danych tekstowych oraz kompresję modeli neuronowych.

prof. UAM dr hab.

Filip Graliński

Zajmuje się przetwarzaniem tekstu i uczeniem maszynowym. Główne zainteresowania to modelowanie języka za pomocą sieci neuronowych, również z uwzględnieniem czasu i grafiki, przetwarzanie tekstów historycznych oraz ewaluacja systemów uczenia maszynowego. Autor systemów Gonito i GEval