Alexa Live Translation

Alexa traduce la conversazione in tempo reale

La funzionalità Live Translation permette ad Alexa di tradurre in tempo reale una conversazione tra due persone che parlano lingue differenti.

Amazon ha annunciato una nuova funzionalità per Alexa che sfrutta una serie di tecnologie avanzate. Gli utenti che possiedono un dispositivo Echo possono chiedere all’assistente personale di tradurre una conversazione in tempo reale tra due persone che parlano lingue differenti. Chi ha un Echo Show vedrà anche la trascrizione sullo schermo.

Inizialmente la funzionalità Live Translation supporterà solo la traduzione tra l’inglese (Stati Uniti) e sei lingue (italiano, francese, tedesco, spagnolo, portoghese e hindi). Gli utenti statunitensi possono quindi avviare conversazioni con un’altra persona pronunciando ad esempio il comando “Alexa, traduci in italiano“. L’assistente riconoscerà automaticamente le parole o frasi e fornirà la traduzione nelle lingue desiderate. Per interrompere la sessione è sufficiente il comando “Alexa, stop“.

L’azienda di Seattle spiega che la funzionalità utilizza diversi sistemi, tra cui il riconoscimento vocale automatico (ASR), Amazon Translate e il text-to-speech. In particolare, durante una sessione di traduzione, Alexa sfrutta due modelli ASR in parallelo, insieme ad un modello separato per l’identificazione della lingua.

L’implementazione parallela è necessaria per ridurre la latenza e dunque fornire la traduzione in tempo reale. In base alla lingua individuata viene scelto l’output di un solo modello ASR che viene inviato ad Amazon Translate. La traduzione viene quindi passata al sistema text-to-speech per la riproduzione vocale.

Ognuno dei sistemi ASR utilizza due tipi di modelli linguistici, uno tradizionale per le frasi brevi e uno basato sulle reti neurali per frasi più lunghe. Lo sviluppo della funzionalità ha richiesto una modifica ai cosiddetti “end-pointer” di Alexa per distinguere le pause più lunghe durante la conversazione dalla fine delle frasi.

Amazon continuerà a migliorare la Live Translation per rendere le conversazioni più naturali tenendo conto di altri fattori, come il tono della voce. Non è noto quando la funzionalità sarà disponibile anche per gli utenti italiani.

PCProfessionale © riproduzione riservata.
Seguo l'evoluzione tecnologia dalla fine degli anni '80 dopo aver acquistato il Commodore 64 e dal 2008 questa passione è diventata un lavoro. Da oltre 12 anni scrivo articoli su diversi argomenti tech e da maggio 2020 ho iniziato la collaborazione con PC Professionale.