Data publikacji w serwisie:

Dobre AI zaczyna si臋 od dobrych danych

W AI nie zawsze chodzi o stworzenie kolejnego modelu. Czasem najwi臋ksz膮 warto艣膰 daje uporz膮dkowanie danych, bez kt贸rych trudno rzetelnie rozwija膰 i testowa膰 technologi臋.

Nasi doktoranci Iwona Christop i Maciej Czajka zaprezentowali na ICASSP 2026 w Barcelonie 馃嚜馃嚫 prac臋 „CAMEO: Collection of Multilingual Emotional Speech Corpora”.

ICASSP to jedna z najwa偶niejszych konferencji na 艣wiecie w obszarze akustyki, mowy i przetwarzania sygna艂贸w.

CAMEO obejmuje 艂膮cznie:

  • 13 uporz膮dkowanych publicznych dataset贸w mowy emocjonalnej,
  • 8 j臋zyk贸w,
  • 41 265 pr贸bek audio,
  • prawie 42 godziny nagra艅,
  • 17 stan贸w emocjonalnych,
  • transkrypcje oraz metadane dotycz膮ce m.in. m贸wc贸w, p艂ci i wieku.

Problem jest prosty: dane do bada艅 nad emocjami w mowie istniej膮, ale s膮 rozproszone, niesp贸jne i trudne do por贸wnywania.

CAMEO zbiera je w jednym miejscu, ujednolica formaty i metadane, a ca艂o艣膰 udost臋pnia na Hugging Face razem z leaderboardem.

To wa偶ne dla rozwoju Speech Emotion Recognition, voice AI, asystent贸w g艂osowych, system贸w call center czy generowania bardziej naturalnej mowy syntetycznej.

Jeden z ciekawszych wniosk贸w?

Niekt贸re modele osi膮ga艂y podejrzanie wysokie wyniki na wybranych datasetach, co mo偶e sugerowa膰, 偶e wcze艣niej by艂y na nich uczone.

W praktycznym AI nie chodzi tylko o model. Chodzi o dane, kontekst i dobrze postawione pytanie.