W AI nie zawsze chodzi o stworzenie kolejnego modelu. Czasem najwi臋ksz膮 warto艣膰 daje uporz膮dkowanie danych, bez kt贸rych trudno rzetelnie rozwija膰 i testowa膰 technologi臋.
Nasi doktoranci Iwona Christop i Maciej Czajka zaprezentowali na ICASSP 2026 w Barcelonie 馃嚜馃嚫 prac臋 „CAMEO: Collection of Multilingual Emotional Speech Corpora”.
ICASSP to jedna z najwa偶niejszych konferencji na 艣wiecie w obszarze akustyki, mowy i przetwarzania sygna艂贸w.
CAMEO obejmuje 艂膮cznie:
- 13 uporz膮dkowanych publicznych dataset贸w mowy emocjonalnej,
- 8 j臋zyk贸w,
- 41 265 pr贸bek audio,
- prawie 42 godziny nagra艅,
- 17 stan贸w emocjonalnych,
- transkrypcje oraz metadane dotycz膮ce m.in. m贸wc贸w, p艂ci i wieku.
Problem jest prosty: dane do bada艅 nad emocjami w mowie istniej膮, ale s膮 rozproszone, niesp贸jne i trudne do por贸wnywania.
CAMEO zbiera je w jednym miejscu, ujednolica formaty i metadane, a ca艂o艣膰 udost臋pnia na Hugging Face razem z leaderboardem.
To wa偶ne dla rozwoju Speech Emotion Recognition, voice AI, asystent贸w g艂osowych, system贸w call center czy generowania bardziej naturalnej mowy syntetycznej.
Jeden z ciekawszych wniosk贸w?
Niekt贸re modele osi膮ga艂y podejrzanie wysokie wyniki na wybranych datasetach, co mo偶e sugerowa膰, 偶e wcze艣niej by艂y na nich uczone.
W praktycznym AI nie chodzi tylko o model. Chodzi o dane, kontekst i dobrze postawione pytanie.


