Az Interspeech konferencia a beszédtechnológiával foglalkozók legnagyobb és legrangosabb éves konferenciája, melyet idén Drezdában rendeztek. A szervezők minden évben versenyt is kiírnak a résztvevőknek. A Computational Paralinguistic Challenge-en a feladat a beszédben rejlő információ kinyerése automatikus módszerekkel. A korábbi években beszéd alapján kellett az alany véralkohol-szintjét megbecsülni, megsaccolni, hogy mióta fut valaki a futópadon, vagy milyen ételt rág a beszéde közben. Idén többek között a Parkinson-kór felismerése volt a cél a beszélő hangja alapján.

A versenyen minden évben 20-25 csapat méretteti meg magát a világ minden tájáról. Idén a szegedi bizonyult a legjobbnak. A csapat tagjai: Gosztolya Gábor és Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos munkatársa és -főmunkatársa, Grósz Tamás, az SZTE TTIK Informatikai Tanszékcsoport doktorandusz hallgatója és Busa-Fekete Róbert, a németországi Paderborni Egyetem oktatója. A szegedi kutatók nem először vettek részt a konferencián és a versenyen, amelyről a korábbi években is szép eredményekkel tértek haza.

A konferencia előtt egy-két hónappal egy honlapon adatbázist helyeznek el, ezen az adatbázison kell a résztvevőknek kísérletezni - mondta el Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos főmunkatársa. A verseny lényege a gépi tanulási algoritmusok használata. Ennek során tanítópéldákat adnak az algoritmusnak, az pedig automatikusan megtalálja az összefüggéseket. A nehézséget általában a megfelelő algoritmus kiválasztása és finomhangolása jelenti. A hang felismerése ezután számítógépen keresztül szoftver segítségével történik.