Data publikacji w serwisie: 22 lipca 2024 r.

POLygraph Polski Zbiór Danych o Fałszywych Informacjach

Z radością informujemy, że artykuł naukowy "POLygraph: Polski Zbiór Danych o Fałszywych Informacjach" został zaakceptowany na prestiżowe warsztaty WASSA Workshop@ACL Conference. Autorami artykułu są Daniel Dzienisiewicz, Filip Graliński, Piotr Jabłoński, Marek Kubis, Paweł Skórzewski i Piotr Wierzchoń. Publikacja ta stanowi znaczący postęp w wykrywaniu fałszywych informacji w języku polskim.

Badania wprowadzają unikalne zasoby do wykrywania fałszywych informacji w języku polskim, składające się z dwóch głównych komponentów:

Zbiór Danych "Fake-or-Not"
Zawiera 11 360 par artykułów informacyjnych z etykietami wskazującymi, czy są one prawdziwe, czy fałszywe. Zapewnia solidną podstawę do szkolenia i testowania modeli uczenia maszynowego.

Zbiór Danych „Fake-They-Say”
Zawiera 5 082 artykułów informacyjnych i powiązanych tweetów. Oferuje bogaty kontekst zrozumienia, jak fałszywe informacje się rozprzestrzeniają i jak są postrzegane.

Tworzenie Zbioru Danch
Zbiór danych POLygraph został stworzony poprzez staranną ręczną adnotację dokonaną zarówno przez ekspertów, jak i niezależnych uczestników, którzy odpowiedzieli na 19 szczegółowych pytań zawartych w artykule. Proces ten zapewnia wiarygodność i głębokość zbioru danych.

Znaczenie Polygraph
POLygraph to przełomowe narzędzie w walce z dezinformacją w Polsce. Dzięki dostarczaniu specjalistycznego zbioru danych dla języka polskiego, wypełnia lukę w zasobach do wykrywania fałszywych informacji. Ten zbiór danych pomoże opracować dokładniejszych algorytmów, przyczyniając się do wyższej jakość informacji i bardziej świadomej opinii publicznej.