Čitaj mi!

Tekstove sa portala RTS-a automatski čita glas Dragana Vučelića

Portal RTS-a obnovio je opciju čitanja tekstova objavljenih na portalu koju najviše koriste slepi i slabovidi, ali i oni koji ne mogu da sami čitaju sa ekrana. Softver je postavila novosadska kompanija AlfaNum, specijalizovana za sintetizaciju glasa i pretvaranje glasa u tekst.

Od 8. oktobra 2020. na sajtu RTS-a mogu da se preslušaju vesti uz pomoć AlfaNumovog najnovijeg sintetizatora baziranog na dubokim neuronskim mrežama, za koji je glas dao spiker, radijski i televizijski voditelj Dragan Vučelić dobitnik nagrade Radio-televizije Srbije za lepotu govora.

Ovaj tim koji je potekao sa Fakulteta tehničkih nauka u Novom Sadu, razvio je sintetičke, muške i ženske glasove za srpski, hrvatski i crnogorski jezik.

Korišćenjem tehnologije za konverziju govora od malog uzorka nečijeg glasa AlfaNum za dve nedelje sintetizuje glas koji zvuči veoma slično glasu osobe čiji je snimak uzet kao osnova.
Primer za to je glas kojim govori digitalni asistent Rajfajzen banke REA.

Osvajanjem ove tehnologije korišćenjem veštačke inteligencije stvorena je mogućnosti za razvoj aplikacija koje mogu da pomognu licima sa raznim oblicima invaliditeta, kao i za razvoj velikog broja drugih aplikacija.

Pomenućemo audio-knjige, aplikacije za onlajn nastavu koja je preko potrebna u sistemu obrazovanja, zvučna obaveštenja u kontakt-centrima, u automobilskoj industriji, robotici itd.

Prošle godine portovana je sinteza na Android OS. Sve slepe i slabovide osobe u Srbiji su dobila mogućnost da besplatno koriste ovu aplikaciju koja omogućava jednostavnu upotrebu svih funkcija uređaja koji koriste Android OS na maternjem jeziku.

AlfaNum tim je radio i na unapređenju automatskog prepoznavanja govora, takođe baziranog na dubokim neuronskim mrežama.

Zahvaljujući tome, završen je Sistem za automatsko prepoznavanje govora za diktiranje medicinskih nalaza za potrebe PIO Fonda koji će ubuduće olakšati rad lekara koji neće više gubiti vreme na kucanje dijagnoza.

Ovako unapređene govorne tehnologije danas omogućavaju znatno širu primenu u poslovnom i privatnom okruženju kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije - između čoveka i mašina.