Microsoft: riconoscimento vocale quasi pari a quello umano

Microsoft: il riconoscimento vocale è simile a quello umano

Microsoft ha comunicato che il suo sistema di riconoscimento vocale ha raggiunto un livello di precisione e di affidabilità davvero notevole.

La notizia che vi riportiamo oggi ci giunge direttamente da Microsoft, e riguarda il suo progetto per la realizzazione di una tecnologia di riconoscimento vocale evoluta: secondo il responsabile del team di ricercatori di Redmond, Xuedong Huang, è stato possibile realizzare un sistema in grado di trascrivere un discorso con una precisione elevatissima, simile a quello umano.

Il primo dato relativo a questo esperimento che balza all’occhio, è quello del margine di errore del sistema di riconoscimento vocale, il quale è pari al 5,9 percento, un risultato che – a detta di Redmond – è pressoché uguale a quello offerto da professionisti che si sono occupati di trascrivere il medesimo contenuto audio che è stato sottoposto alla macchina durante i test.

Sfruttando dei modelli di reti neurali del linguaggio, che sono in grado di raggruppare parole simili, il sistema permette di ottenere un maggior livello di efficienza e, secondo quanto reso noto da Microsoft, questa soluzione sarà implementata anche all’interno dell’assistente virtuale personale Cortana, già disponibile su Windows 10 e Xbox One.

Sebbene i test effettuati da Redmond possano essere sorprendenti, bisogna comunque considerare come il sistema di riconoscimento vocale approntato da Microsoft abbia offerto risultati soddisfacenti nel particolare contesto del test: non è detto che la macchina riesca ad offrire performance altrettanto soddisfacenti all’interno di condizioni di “vita reale”, dove non mancano elementi di disturbo, voci che si sovrastano, dialoghi interrotti e altri aspetti simili che complicano l’ascolto e la comprensione.