Tante aziende, a partire dai nomi più noti, sono impegnate nello sviluppo di soluzioni per l’intelligenza artificiale. Con l’iniziativa Common Voice, Mozilla, da parte sua, intende mettere gratuitamente a disposizione di tutti gli sviluppatori dati che di norma sono difficili da trovare e comunque piuttosto costosi.
Con Common Voice Mozilla vuole “insegnare alle macchine come la gente parla nella vita reale“: ad oggi il già ricco database che viene offerto a ogni programmatore ospita oltre 7.200 ore di parlato in 54 lingue diverse.
Quanto prodotto è frutto del lavoro di decine di volontari che si stanno prodigando nella registrazione delle voci, nell’analisi e nella classificazione delle stesse.
Il dataset diventa così impiegabile per realizzare applicazioni in grado di comprendere puntualmente i comandi degli utenti e di instaurare veri e propri dialoghi. L’obiettivo è infatti quello di rendere alla portata di tutti lo sviluppo di sistemi text-to-speech e speech-to-text senza appoggiarsi a soluzioni proprietarie.
“Le tecnologie di riconoscimento vocale conferiscono una dimensione umana ai nostri dispositivi, ma gli sviluppatori hanno bisogno di un’enorme quantità di dati vocali per crearle“, si spiega da Mozilla. Con il progetto Common Voice si vuole proprio colmare il divario nel settore del riconoscimento vocale digitale.
Facendo riferimento a questa pagina è possibile scaricare il dataset delle registrazioni in lingua italiana: gigabyte di dati contenenti centinaia di ore di parlato già convalidate e altre invece ancora oggetto di verifiche.
Oltre a poter essere utilizzati per sviluppare progetti in proprio, i dati di Mozilla verranno sfruttati per costruire un motore di riconoscimento vocale open source chiamato Deep Speech.
A questo indirizzo è stato pubblicato un abbozzo di assistente digitale che in futuro potrebbe debuttare come funzionalità integrata nel browser Firefox.