Zespół lingwistyki diachronicznej

Język zmienia się z upływem lat. W inny sposób posługiwano się nim 200 lat temu niż obecnie. Lingwistyka diachroniczna zajmuje się językiem naturalnym, uwzględniając kontekst czasu. Oprócz poszerzania wiedzy czysto lingwistycznej nasze badania dają nam wgląd w sposób, w jaki myśleli ludzie w przeszłości i w tematy, które były dla nich ważne. Poza tym mają charakter czysto praktyczny- pozwalają na budowanie lepszych modeli uczenia maszynowego. Przykładowo: znając odpowiednik słowa w przeszłości (np. samolot-aeroplan) można stworzyć lepszą wyszukiwarkę tekstów historycznych.

Badania tradycyjnie prowadzone są metodami językoznawstwa. Od niedawna na popularności zyskują metody uczenia maszynowego (w szczególności modele neuronowe). W naszym zespole łączymy oba podejścia, gdyż składamy się ze specjalistów zarówno lingwistyki, jak i informatyki.

Obecnie skupiamy się głównie na języku polskim oraz angielskim. Badamy przede wszystkim teksty pochodzące z czasopism datowanych od XIX wieku. Zajmujemy się także bardziej aktualnymi, krótszymi wycinkami czasu- kilku lub kilkunastu lat. Problemy, które rozwiązujemy to datowanie tekstów (podanie daty powstania lub publikacji tekstu), modelowanie językowe, wykrywanie i analiza trendów posługiwania się frazami w czasie.

Działamy jako cześć konsorcjum DARIAH-PL, które zajmuje się ogólnie pracą w zakresie humanistyki cyfrowej w Polsce.

Członkowie zespołu

mgr inż.

Jakub Pokrywka

Doktorant na WMI. Pracuje nad neuronowym przetwarzaniem języka naturalnego. Zajmuje się modelowaniem języka (w tym diachronią języka), ekstrakcją informacji, agentami dialogowymi, a także w mniejszym stopniu widzeniem komputerowym i analizą danych. Pracował m.in. dla Samsunga, Allegro, Supermemo.

mgr

Marcin Pigulak

magister historii i filmoznawstwa, doktorant UAM. Wśród zainteresowań badawczych znajdują się audiowizualne oraz cyfrowe przejawy kultury historycznej, sposoby konstruowania dyskursów o przeszłości, a także źródłoznawcze aspekty humanistyki cyfrowej.

Konsultant

prof. UAM dr hab.

Filip Graliński

Zajmuje się przetwarzaniem tekstu i uczeniem maszynowym. Główne zainteresowania to modelowanie języka za pomocą sieci neuronowych, również z uwzględnieniem czasu i grafiki, przetwarzanie tekstów historycznych oraz ewaluacja systemów uczenia maszynowego. Autor systemów Gonito i GEval