Successivo
Microsoft IA image captioning

Tech

Microsoft IA descrive le immagini come una persona

Luca Colantuoni | 15 Ottobre 2020

Microsoft

Microsoft ha sviluppato un algoritmo di intelligenza artificiale che descrive automaticamente le immagini con una accuratezza simile a quella delle persone reali.

I ricercatori di Microsoft hanno sviluppato un nuovo algoritmo di intelligenza artificiale che permette di generare automaticamente una descrizione delle immagini. Tra le possibili applicazioni della tecnologia ci sono i motori di ricerca e i software per utenti con problemi visivi. L’azienda di Redmond ha utilizzato l’algoritmo nell’app Seeing AI.

Microsoft spiega che la funzionalità di “image captioning” è una delle sfide più difficili nel campo della computer vision, in quanto l’intelligenza artificiale deve comprendere e descrivere il contenuto di un’immagine. Il nuovo sistema sviluppato dall’azienda di Redmond non identifica solo gli oggetti nell’immagine, ma anche le relazioni tra essi. La capacità di riconoscimento è due volte superiore alla prima versione del 2015.

Nel video si possono vedere i miglioramenti. Ad esempio, invece di identificare un gatto in primo piano, l’intelligenza artificiale identifica un gatto grigio con gli occhi chiusi. La descrizione automatica delle immagini può essere sfruttata nelle ricerche online o nelle applicazioni. Entro fine anno verrà inclusa in Word e Outlook per Windows e macOS, oltre che nelle versioni web, Windows e macOS di PowerPoint.

Il nuovo algoritmo viene utilizzato in Seeing AI per iOS, l’app sviluppata da Microsoft che consente a non vedenti e ipovedenti di avere una descrizione degli oggetti inquadrati dalla fotocamera dello smartphone. La funzionalità di image captioning viene sfruttata per descrivere le foto pubblicate online, molte delle quali non hanno l’attributo alt text riconosciuto dagli screen reader.

Il nuovo modello sarà disponibile tramite gli Azure Cognitive Services, quindi tutti gli sviluppatori potranno utilizzarlo per migliorare l’accessibilità delle loro app.