Robotas beveik neklysdamas suprato LRT televizijos žinių vedėjos Justės Tamošaitienės tarseną (99,85 proc.). Taip pat sklandžiai atpažino kone visus TV žinių vedėjų Guodos Pečiulytės ir Igno Andriukevičiaus bei LNK žinių vedėjos Linos Kairytės žodžius (visi trys – per 99 proc.).
„Matome, kad šalies TV žinių vedėjų tarsena yra labai raiški, o ir pats intelektas sparčiai mokosi – palyginti su praėjusiu tyrimu, vedėjų šneką jis atpažino geriau: iš penkių minučių žinių įrašo, suklupdavo vos ties vienu – kitu žodžiu. Tikslas yra pasiekti, kad šneka būtų atpažinta visu 100 procentų“, – sakė „Kantar“ komunikacijos monitoringo ir analizės skyriaus vadovas Deividas Butkus.
Vidutiniškai šalies TV žinių vedėjų šneką dirbtinis intelektas sugebėjo atkurti, t.y. paversti tiksliu tekstu, daugiau kaip 98,3 proc. tikslumu (prieš porą metų – beveik 3 proc. punktais mažiau).
Greitakalbė netrukdo
Per penkias minutes šalies žinių vedėjai ištaria vidutiniškai 580 žodžių, tačiau aiškios tarsenos lyderė J. Tamošaitienė tuo pačiu yra ir greitakalbė: per šį laiką ji ištarė net 645 žodžius, nepakenkdama artikuliacijai. Už ją greičiau kalba tik „Info TV“ ir BTV žinių vedėjas Viktoras Jakovlevas (659 žodžiai) – tiesa, jo šneką atpažindamas dirbtinis intelektas klydo daugiau.
Robotas atpažino ir daugiau kaip 98 proc. Aistės Plaipaitės (LRT), Marijaus Žiedo (LRT), Roko Petkevičiaus (TV3) bei Eglės Bučelytės (LRT) šnekos. Aiškiausiai kalbančių vedėjų dešimtuką vainikuoja Jolita Vitkauskė ir Aurelijus Bezekavičius. Tyrimas analizavo aštuoniolikos žinių vedėjų pranešimus 5 nacionaliniuose TV kanaluose.
Aiškiausiai kalbančių vedėjų dešimtukas
Pasak bendrovės „Kantar“, kuri šnekos atpažinimo dirbtinį intelektą naudoja naujienų monitoringui ir analizei, Lietuva gali didžiuotis aiškios dikcijos žinių vedėjais.
„Kaip matome iš sąrašo, dirbtinis intelektas be vargo atpažįsta šalies vedėjų šneką, tad jų tartis yra nepriekaištinga. Net ir už dešimtuko žymos išsidėsčiusių žinių vedėjų kalbos atpažįstamumas siekia 96-98 procentus“, – sakė D. Butkus.
Technologija šneką paverčia tekstu
Naujovišką žinių monitoringo sprendimą rinkos tyrimų bendrovė „Kantar“ sukūrė kartu su kalbos technologijų bendrove „Tilde IT“. Be šios srities, dirbtinio intelekto technologija taip gali būti naudojama pagreitinant žurnalistų, teismo ar posėdžių stenografų bei skambučių centrų darbus.
„Automatinio šnekos atpažinimo technologija yra nuolat tobulinama, intelektas mokosi vis naujų specifinių žodžių ir sąsajų sakiniuose. Vis daugiau medijų plečiasi į audio ir video platformas, sparčiai auga tinklalaidžių turinys, o tokie įrankiai padeda analizuoti turinį bet kurioje auditorijos pasirinktoje platformoje nedidinant kaštų. Dabar pagrindinis iššūkis yra atpažinti kalbą iš žemos kokybės signalo, pavyzdžiui, kai pašnekovas skambina į studiją mobiliuoju telefonu, tačiau irgi tik laiko klausimas, kada tai bus išspręsta“, – sakė D. Butkus.
Automatinio šnekos atpažinimo technologija yra pagrįsta giluminių neuroninių tinklų modeliu, kuris dirbtinį intelektą išmoko atpažinti žodžius ir tam tikras jų struktūras. Roboto mokymui panaudota daugiau kaip 250 valandų garsynas, 58 milijonai lietuviškų sakinių ir per 600 tūkstančių žodžių. Ypatingas dėmesys skirtas raktažodžiams, susijusiems su verslo komunikacija.
Programos kūrėjų teigimu, vis daugėjant garso ir vaizdo informacijos, ilgainiui be šnekos atpažinimo technologijų negalės išsiversti jokia su duomenimis dirbanti bendrovė ar organizacija.