Google ha spiegato come sta utilizzando il deep learning per migliorare il suo servizio Maps.
Google Maps fornisce indicazioni stradali, dati sul traffico in tempo reale e informazioni sugli esercizi commerciali di tutto il mondo. È quindi fondamentale che le i dati utilizzati da Google per comporre le sue mappe siano costantemente aggiornati.
I tecnici della società di Mountain View hanno allora studiato un sistema estremamente efficace per raccogliere gli aggiornamenti sui nomi delle strade e sulle insegne delle attività: sfruttare il vastissimo database di immagini raccolte dai veicoli di Street View.
Relativamente ai nomi delle strade francesi, l’algoritmo ha permesso di raggiungere l’84,2% di accuratezza, un dato che supera quello di qualunque altro sistema fino ad oggi utilizzato.
Il modello TensorFlow sviluppato da Google e reso disponibile pubblicamente poggia su un meccanismo di riconoscimento ottico dei caratteri (OCR) combinato con algoritmi di machine learning.
Riconoscere i nomi di vie e locali commerciali partendo da immagini raccolte da una vettura in movimento non è affatto semplice: sono spesso presenti artefatti, ostacoli, aree sfocate, elementi distorti e così via.
La rete neurale realizzata dagli ingegneri della società d’Oltreoceano ha permesso di risolvere brillantemente il problema dell’aggiornamento di Google Maps analizzando le informazioni che appaiono nelle foto del “mondo reale” periodicamente raccolte dalle auto di Street View.
Il database dei cartelli stradali francesi è una ricchissima base dati che contiene oltre un milione di nomi di strade e che può essere utilizzato come base per l’addestramento di qualunque modello per l’apprendimento automatico (maggiori informazioni a questo indirizzo).