Google: ecco WaveNet, la voce "umana" dell'intelligenza artificiale DeepMind

Google: ecco WaveNet, la voce “umana” dell’intelligenza artificiale DeepMind

Ancora una volta, l’intelligenza artificiale di Google – DeepMind – riesce a far parlare di sé grazie agli incredibili sviluppi raggiunti con WaveNet, la voce “umana” dell’AI di Big G.

Dal mondo dell’intelligenza artificiale made in Mountain View arrivano notizie veramente interessanti: il team di DeepMind che si occupa di AphaGo, infatti, è stato in grado di realizzare una tecnologia che permette di ottenere un simulatore vocale umano, WaveNet, in grado di sfruttare le reti neurali per produrre dei suoni contraddistinti da una forma di onda molto evoluta, sostanzialmente indistinguibile da quella di una voce umana.

Al momento, questo tipo di tecnologia si basa su due approcci differenti: l’intelligenza artificiale associata generalmente alla riproduzione vocale, infatti, è in grado di comporre frasi a partire da parole che siano state registrate in precedenza da persone in carne ed ossa, oppure, sfrutta le capacità di un software di creare file audio composti sfruttando la conoscenza delle regole grammaticali e della sintassi apprese in precedenza.

Nel caso di WaveNet, il processo viene compiuto in maniera non molto differente da quanto indicato nel primo caso, sebbene l’intelligenza artificiale di Big G non si basi sulle brevi registrazioni audio, bensì, cerca di riprodurre dei file sonori imitando ciò che fanno le persone, sfruttando peraltro accenti, pause, respiri e adottando toni differenti a seconda del contesto e delle emozioni che intende esprimere.

La novità realizzata dal team di DeepMind, inoltre, è in grado – qualora fosse abbinata ad un filmato – di operare anche con il labiale.