Machine Learning

Mozilla DeepSpeech, IA di trascrizione audio dal futuro incerto

Dopo i licenziamenti annunciati nei giorni scorsi, Mozilla si prepara a un futuro pieno di incognite. DeepSpeech potrebbe essere una delle vittime del nuovo corso.

Mozilla e Google hanno appena rinnovato l’accordo per l’integrazione continuata del search di Mountain View in Firefox, e le finanze della corporation resteranno al sicuro per almeno altri tre anni. Per quanto riguarda il futuro dei tanti progetti attualmente in sviluppo, invece, l’incertezza regna oramai sovrana.

Prima ancora del rinnovo dell’accordo con Google, infatti, Mozilla ha annunciato il licenziamento di 250 dipendenti con lo scopo di riposizionare il business in epoca post-COVID-19. Chi è ancora al lavoro presso la corporation è Reuben Morais, responsabile di DeepSpeech che ora non nasconde le preoccupazioni per la continuazione del progetto.

Mozilla

DeepSpeech è un’implementazione di Mozilla Voice STT, un engine di trascrizione audio in tempo reale (Speech-To-Text o appunto STT) addestrato tramite gli algoritmi di machine learning, una IA STT che vorrebbe fornire un’alternativa open source ai servizi proprietari offerti dai colossi di settore come Google (Traduttore), Amazon (Alexa) e altri.

La tecnologia di DeepSpeech si fonda sul lavoro già compiuto dai ricercatori di Baidu (Deep Speech) e Google (TensorFlow) in ambito di machine learning, il servizio è in grado di girare su ogni genere di piattaforma (da Windows ad Android passando per Raspberry Pi 4) e presto sarà “laureato” con la pubblicazione della main release (1.0) ufficiale.

Ma il futuro di DeepSpeech è in forse, ha scritto francamente Morais, perché la ristrutturazione decisa da Mozilla potrebbe portare alla cancellazione delle energie e dei fondi allocati per il progetto. Nel caso in cui i vertici della corporation confermassero l’abbandono, comunque, lo sviluppatore già suggerisce le possibili alternative: Mozilla Voice STT è un progetto open source, quindi continuerà a esistere finché ci sarà qualcuno interessato a realizzare un’alternativa FOSS ai traduttori intelligenti dei colossi commerciali.

PCProfessionale © riproduzione riservata.
Ha avuto il suo incontro fatale con la tecnologia negli anni '80, prima con i giochi arcade e poi con l'Intellivision di Mattel, e da allora la passione è andata solo aumentando. Quando non passa il proprio tempo a consumare notizie sull'attualità informatica ama leggere (su carta), scrivere, fotografare e collezionare vecchi libri sui sistemi operativi obsoleti.