Sundar Pichai, CEO di Google, ha svelato il funzionamento di un nuovo strumento che presto verrà messo nelle mani degli utenti e in particolare di tutti coloro che sono in possesso di un dispositivo capace di supportare Google Assistant: Assistente Google migliora ancora e risponde ai comandi vocali in italiano.
Battezzata Google Duplex, si tratta di una nuova funzionalità che estende enormemente le abilità dell’assistente digitale.
Duplex permette di stabilire conversazioni telefoniche con gli esercizi commerciali di ogni genere: sul palco della Google I/O, Pichai ha dimostrato come l’assistente sia in grado di fissare un appuntamento dal parrucchiere o prenotare un tavolo al ristorante.
Il nuovo strumento è capace di analizzare in tempo reale le risposte fornite dall’interlocutore ed esprimersi di conseguenza, contestualizzando ogni informazione o indicazione ottenuta.
Com’è possibile verificare nel video che pubblichiamo di seguito, Google Duplex ha saputo gestire anche una situazione complessa come quella della responsabile del ristorante che sosteneva come la loro struttura non accettasse prenotazioni per un numero di persone inferiore a sette.
Duplex è riuscito a comprendere le spiegazioni e, addirittura, a chiedere se senza prenotazione l’attesa per sedersi al tavolo fosse lunga o meno.
Il bello è che l’assistente vocale sembra riuscire a padroneggiare bene l’utilizzo delle cosiddette interiezioni primarie come eh, ehi, ahah, ehm, uhm e così via.
Come funziona Google Duplex
Duplex utilizza in primo luogo il sistema di riconoscimento vocale sviluppato da Google (RAV o ASR in figura) quindi inietta la conversazione in una rete neurale ricorrente (RNR).
Essa differisce rispetto alle reti neurali di tipo tradizionali per il fatto di riuscire a connettere le unità di output con quelle intermedie e con quelle di input. All’atto pratico, quindi, la rete neurale può adattare il suo comportamento alle variazioni che si manifestano “in corso d’opera”.
La rete neurale ricorrente viene costruita usando la libreria TensorFlow Extended (TFX) di Google ed eseguita simultaneamente su una batteria di server ospitati presso i centri di calcolo della multinazionale statunitense.
Per addestrare la RNR i tecnici di Google spiegano di aver utilizzato migliaia di conversazioni telefoniche opportunamente rese anonime (i dati in esse trasmessi non permettono di risalire ai vari interlocutori).
Duplex riesce a capire alla perfezione il contesto di ciascuna chiamata, ciò che l’utente desidera, le caratteristiche del prodotto o del servizio che intende ottenere e così via: ciò è possibile concatenando il testo alle parole pronunciate dal sintetizzatore vocale (CTV o TTS nella figura).
Ovviamente ci si scordi di avere subito Duplex anche in Italia: i primi test di integrazione con Google Assistant inizieranno in estate e, verosimilmente, la funzionalità potrebbe essere presentata ai possessori – anglofoni – degli smartphone Pixel in autunno.