Zespół lingwistyki diachronicznej
Język zmienia się z upływem lat. W inny sposób posługiwano się nim 200 lat temu niż obecnie. Lingwistyka diachroniczna zajmuje się językiem naturalnym, uwzględniając kontekst czasu. Oprócz poszerzania wiedzy czysto lingwistycznej nasze badania dają nam wgląd w sposób, w jaki myśleli ludzie w przeszłości i w tematy, które były dla nich ważne. Poza tym mają charakter czysto praktyczny- pozwalają na budowanie lepszych modeli uczenia maszynowego. Przykładowo: znając odpowiednik słowa w przeszłości (np. samolot-aeroplan) można stworzyć lepszą wyszukiwarkę tekstów historycznych.
Badania tradycyjnie prowadzone są metodami językoznawstwa. Od niedawna na popularności zyskują metody uczenia maszynowego (w szczególności modele neuronowe). W naszym zespole łączymy oba podejścia, gdyż składamy się ze specjalistów zarówno lingwistyki, jak i informatyki.
Obecnie skupiamy się głównie na języku polskim oraz angielskim. Badamy przede wszystkim teksty pochodzące z czasopism datowanych od XIX wieku. Zajmujemy się także bardziej aktualnymi, krótszymi wycinkami czasu- kilku lub kilkunastu lat. Problemy, które rozwiązujemy to datowanie tekstów (podanie daty powstania lub publikacji tekstu), modelowanie językowe, wykrywanie i analiza trendów posługiwania się frazami w czasie.
Działamy jako cześć konsorcjum DARIAH-PL, które zajmuje się ogólnie pracą w zakresie humanistyki cyfrowej w Polsce.
Członkowie zespołu

mgr inż.
Jakub Pokrywka

mgr
Marcin Pigulak
Konsultant

prof. UAM dr hab.
Filip Graliński