microsoft-sistema-riconoscimento-vocale-simile-umano

News

Microsoft: il riconoscimento vocale è simile a quello umano

Davide Micheli | 19 Ottobre 2016

IA Microsoft

Microsoft ha comunicato che il suo sistema di riconoscimento vocale ha raggiunto un livello di precisione e di affidabilità  davvero notevole.

La notizia che vi riportiamo oggi ci giunge direttamente da Microsoft, e riguarda il suo progetto per la realizzazione di una tecnologia di riconoscimento vocale evoluta: secondo il responsabile del team di ricercatori di Redmond, Xuedong Huang, è stato possibile realizzare un sistema in grado di trascrivere un discorso con una precisione elevatissima, simile a quello umano.

Il primo dato relativo a questo esperimento che balza all’occhio, è quello del margine di errore del sistema di riconoscimento vocale, il quale è pari al 5,9 percento, un risultato che – a detta di Redmond – è pressoché uguale a quello offerto da professionisti che si sono occupati di trascrivere il medesimo contenuto audio che è stato sottoposto alla macchina durante i test.

Sfruttando dei modelli di reti neurali del linguaggio, che sono in grado di raggruppare parole simili, il sistema permette di ottenere un maggior livello di efficienza e, secondo quanto reso noto da Microsoft, questa soluzione sarà  implementata anche all’interno dell’assistente virtuale personale Cortana, già  disponibile su Windows 10 e Xbox One.

Sebbene i test effettuati da Redmond possano essere sorprendenti, bisogna comunque considerare come il sistema di riconoscimento vocale approntato da Microsoft abbia offerto risultati soddisfacenti nel particolare contesto del test: non è detto che la macchina riesca ad offrire performance altrettanto soddisfacenti all’interno di condizioni di “vita reale”, dove non mancano elementi di disturbo, voci che si sovrastano, dialoghi interrotti e altri aspetti simili che complicano l’ascolto e la comprensione.

Blob Opera

Tech

Blob Opera, l’esperimento operistico di Google a base di machine learning

Alfonso Maruccia | 17 Dicembre 2020

Google IA Servizi Web

Gli algoritmi intelligenti del machine learning danno vita a Blob Opera, ennesimo esperimento pubblicato da Google con un focus sul canto operistico.

Sfruttando le capacità del machine learning, David Li e Google hanno dato vita a Blob Opera, l’ennesimo esperimento pensato per esemplificare le possibili applicazioni degli algoritmi intelligenti. Una applet Web canterina, dove la voce (reale) dei cantanti viene gestita e armonizzata in automatico dalla IA.

Blob Opera è un esperimento interattivo in cui l’utente può “manipolare” le voci di basso, tenore, soprano e mezzo soprano, stabilendo il tono con un movimento verticale e la vocale con un movimento orizzontale da destra a sinistra. Il controllo riguarda un solo “blob” alla volta, mentre gli altri cantanti gommosi fanno da accompagnamento grazie agli algoritmi della IA.

https://www.youtube.com/watch?v=ZfLYuXi6sDI

Com’è tipico delle applicazioni di machine learning, dietro Blob Opera c’è un lungo lavoro di training della IA basato su dati e performance reali. Grazie al coinvolgimento di Google, il designer David Li ha potuto contare sulla registrazione di 16 ore di materiale e vocalizzazioni a opera del tenore Christian Joel, del basso Frederick Tong, del soprano Olivia Doutney e del mezzo soprano Joanna Gamble.

Oltre al controllo dei singoli blog canterini, l’esperimento Blob Opera permette all’utente di registrare le proprie composizioni e di condividerle tramite social network. Dal pulsante a forma di albero di natale in basso a destra è invece possibile accedere a registrazioni pre-esistenti a tema eminentemente festivo.

Coronavirus di Wuhan

Tech

COVID-19, una IA per identificare gli asintomatici dai colpi di tosse

Alfonso Maruccia | 3 Novembre 2020

App COVID-19 IA

I ricercatori del MIT hanno messo a punto un algoritmo di intelligenza artificiale in grado di riconoscere gli infetti asintomatici di COVID-19. E ora lavorano alla realizzazione di una app per smartphone.

La nuova intelligenza artificiale creata dai ricercatori del Massachusetts Institute of Technology (MIT) ha una portata potenzialmente storica, visto che è in grado di riconoscere chi è portatore del virus del COVID-19 anche in assenza di sintomi. Uno strumento di identificazione e scrematura dei contagi che in futuro potrebbe forse arrivare gli smartphone degli utenti di tutto il mondo.

La IA dell’MIT lavora sulle registrazioni sonore dei colpi di tosse, un segnale che a quanto pare si differenzia in maniera notevole (quando campionato in formato digitale) tra chi è perfettamente sano, chi ha contratto il virus SARS-CoV-2 e chi ha sviluppato l’infezione comunemente nota come COVID-19.

L’algoritmo messo a punto dai ricercatori statunitensi è stato addestrato con l’ascolto di decine di migliaia di colpi di tosse campionati, oltre che con registrazioni di pronunce comuni. Alla fine del periodo di training, la IA ha raggiunto un livello di affidabilità decisamente significativo: il sistema sarebbe in grado di identificare le infezioni da COVID-19 nell’98,5% delle registrazioni, e addirittura di riconoscere i portatori asintomatici nel 100% dei casi.

Il MIT è ora in attesa dell’approvazione da parte della FDA (Food and Drug Administration) statunitense prima della distribuzione al pubblico, e come è ovvio una app realizzata a partire dal nuovo algoritmo potrebbe cambiare in maniera radicale la situazione sanitaria globale. Lavoratori, professionisti della salute o semplici cittadini sarebbero in tal modo in grado di fare uno screening di prossimità a costo (augurabilmente) zero, permettendo di interrompere la catena dei contagi che ha ripreso a correre in Europa e non si è mai fermata negli USA.

NVIDIA contro COVID-19

Tech

[email protected], trovati potenziali bersagli per una cura contro il COVID-19

Alfonso Maruccia | 30 Ottobre 2020

COVID-19 [email protected] HPC IA

Il progetto [email protected] concentrato nel contrasto al COVID-19 ha portato alla scoperta di possibili strutture proteiche da prendere di mira nello sviluppo di una cura o un vaccino.

La pandemia di COVID-19 cavalca senza sosta con 45 milioni di persone infette e quasi 1,2 milioni di morti in tutto il mondo. Ricercatori e aziende sono impegnati al massimo nello studio del virus SARS-CoV-2 per la possibile formulazione di una cura o un vaccino efficaci, una scoperta degna come minimo del premio Nobel e potenzialmente destinata a fare la storia.

È impegnata su questo fronte anche [email protected], l’iniziativa di calcolo distribuito che sfrutta le CPU e le GPU degli utenti comuni per effettuare complesse simulazioni sulle strutture proteiche del SARS-CoV-2. La proliferazione del coronavirus ha provocato un autentico boom nelle “donazioni” di tempo-macchina da parte degli utenti, permettendo a [email protected] di raggiungere e superare i 2,4 exaFLOPS di potenza complessiva.

Folding@Home contro il COVID-19

Stando a una ricerca recentemente pubblicata online, il team di [email protected] avrebbe già messo a buon frutto i miliardi di miliardi di calcoli al secondo del network distribuito scoprendo alcuni dei più inaccessibili “segreti” del SARS-CoV-2. I ricercatori hanno individuato 50 “sacche criptiche” di peplomeri, ovvero le protuberanze che permettono ai coronavirus come il SARS-CoV-2 di legarsi ai recettori della cellula ospite invadendola e dando inizio all’infezione.

Le protuberanze con i recettori chiave del coronavirus che causa il COVID-19 sono normalmente ripiegate su se stesse, ma devono prima o poi “svelarsi” per attaccare le cellule di una persona infetta. L’imponente rete di calcolo di [email protected] ha permesso di identificare, per la prima volta in assoluto, la porzione del virus necessaria allo sviluppo dell’infezione. E che ora potrà offrire ai ricercatori e alle aziende farmaceutiche un possibile bersaglio per una cura definitiva o un vaccino massimamente efficace contro la prima pandemia del 21esimo secolo.

Aggiungi alla collezione

No Collections

Here you'll find all collections you've created before.