Googleovi istraživači ‘istrenirali‘ su neuronski mrežu kako bi mogla mapirati glasovni otisak s jednog jezika na drugi.
Možda zvuči komplicirano, ali radi se o Googleovom prevoditelju koji osim što prevodi, zadržava i glas izvornog govornika. To je u mogućnosti učiniti jer umjetna inteligencija pretvara audio ulaz direktno u audio izlaz bez posredničkih koraka, piše Technology Review.
Tradicionalni prevoditelji ili translacijski sustavi prvo pretvaraju zvuk u tekst, a zatim ponovno u zvuk, pritom gubeći karakteristike izvornog glasa.
Novi Googleov sustav je nazvan ‘Translatotron‘ i ima tri komponente od kojih su sve prate zvučni spektrogram govornika, koji se često naziva glasovni otisak.
Prva komponenta koristi neuronsku mrežu koja mapira audio spektrogram ulaznog jezika u audio spektrogram drugog jezika.
Druga komponenta pretvara spektrogram u audio zapis koji se može reproducirati, dok treća komponenta ‘lijepi‘ vokalne karakteristike i osobine izvornog jezika natrag u konačni audio izlaz.
Translatotron je trenutno u fazi testiranja i do sada je testiran samo prijevod sa španjolskog na engleski i još nije savršen, ali već sada pokazuje potencijal za komercijalnu upotrebu u bližoj budućnosti, a kako sve to zvuči možete provjeriti na linku.