Si immagini che un oggetto possa rispondere alle indicazioni vocali di una persona anche in condizioni ambientali particolarmente rumorose (ad esempio quando dovesse suonare un allarme antincendio). Si pensi ad un sistema che possa identificare tutti i soggetti che si muovono in una abitazione oppure in un ufficio.
Si pensi, ancora, ad un meccanismo che sblocchi automaticamente una porta effettuando un’analisi vocale o sia in grado di riconoscere le nostre emozioni analizzando la mimica facciale.
Ecco, Microsoft sta sviluppando la tecnologia che permette di fare tutto ciò ed altro ancora con Project Oxford.
L’iniziativa Project Oxford è stata presentata in occasione dell’ultima edizione della Build Conference e mira a porre le basi per una serie di servizi di machine learning basati sul cloud.
Che cos’è il machine learning
Con il termine machine learning o apprendimento automatico si fa riferimento ad una delle aree fondamentali dell’intelligenza artificiale incentrata sullo sviluppo di sistemi ed algoritmi capaci di sintetizzare una serie di successive osservazioni.
A partire da insiemi più o meno ampi di dati, la macchina – proprio utilizzando i sistemi e gli algoritmi messi a punto – diviene capace di riconoscere automaticamente modelli complessi ed assumere “decisioni”.
Google ha presentato, proprio nei giorni scorsi, la piattaforma TensorFlow: Machine learning: Google presenta TensorFlow.
Essa si propone come uno strumento “aperto”, accessibile da qualunque sviluppatore voglia utilizzare l’intelligenza artificiale in salsa Google per effettuare elaborazioni complesse ed analizzare ampie basi di dati in ottica machine learning.
Il machine learning di Microsoft basato su Azure
A distanza di appena qualche giorno dall’annuncio reso da Google, Microsoft propone alcuni esempi di servizi che presuppongono l’utilizzo di tecnologie per il machine learning.
A maggio la società di Redmond aveva presentato uno strumento per la stima dell’età di una persona: Calcolo età di una persona: molto più che un gioco.
Adesso, Project Oxford si arricchisce di altri servizi. Microsoft ha per esempio messo a disposizione di chiunque voglia usarle, API in grado di usare l’intelligenza artificiale per stabilire se una persona, raffigurata in una foto, sia arrabbiata, triste, impaurita, felice, disgustata o manifesti disprezzo.
Una dimostrazione è pubblicamente accessibile da questa pagina ma è a questo indirizzo che gli sviluppatori possono documentarsi in vista dell’utilizzo della nuova API di Microsoft.
Tutte le API di Project Oxford possono essere evidentemente utilizzate in seno ad altri progetti realizzati in proprio.
Un’altra API, battezzata Spell Check, permette ad esempio di rilevare e correggere i più comuni errori ortografici comprendendo il contesto ed il “significato” delle frasi.
Altri API, che saranno ottimizzate entro la fine dell’anno, permettono di analizzare il contenuto di sequenze filmate – anche in tempo reale – riconoscendo i movimenti delle persone, i volti e gli oggetti ritratti.
Un altro servizio, infine, consentirà un’analisi del timbro vocale per discernere i vari individui.
Le demo dei vari servizi in corso di sviluppo sono accessibili da questa pagina.