Creare un assistente vocale con Voiceflow e l'intelligenza artificiale

Con l’avvento dei moderni modelli generativi, l’interazione uomo-macchina ha subìto una significativa trasformazione grazie alla diffusione delle cosiddette interfacce conversazionali. Una piattaforma come Voiceflow rivoluziona il modo con cui possono essere progettati e sviluppati assistenti vocali e chatbot, consentendo a utenti privati, professionisti e aziende di creare esperienze utente intuitive e personalizzate, senza la necessità di competenze di programmazione avanzate.

Voiceflow rappresenta un vero e proprio punto di svolta nel campo della progettazione e della realizzazione di interfacce conversazionali. Il fine ultimo degli sviluppatori della piattaforma è rendere accessibile a tutti la creazione di assistenti vocali e chatbot, grazie all’utilizzo di un ambiente visuale drag-and-drop che consente agli utenti di progettare, testare e implementare flussi di conversazione complessi con estrema facilità.

Anche nel profilo completamente gratuito, Voiceflow mette a disposizione degli interessanti fino a 100.000 token utilizzabili mensilmente con tutti i principali Large Language Model (LLM).

Cos’è e come creare un chatbot o un assistente vocale con Voiceflow

Avete bisogno di un chatbot personalizzato per la vostra attività? Voiceflow consente di realizzarlo in pochi minuti, con la possibilità di ottenere il codice per integrarlo direttamente su siti e applicazioni Web.

Per iniziare, basta cliccare su New agent, in alto a destra nell’interfaccia Web di Voiceflow, quindi scegliere se si fosse interessati a sviluppare un chatbot o un assistente vocale. La selezione dell’una o dell’altra voce permette di accedere a blocchi funzionali molto diversi: è quindi bene avere ben chiaro sin dall’inizio che cosa si desidera realizzare.

Creare assistente vocale con Voiceflow

Utilizzando una serie di blocchi e step, gli utenti possono definire il dialogo tra l’utente e l’assistente vocale. Voiceflow consente di gestire decisioni basate sugli input dell’utente o su altre variabili, integrare chiamate API esterne e ottenere dati in tempo reale da qualunque tipo di sorgente.

Guardate l’esempio in figura. I vari blocchi compongono uno strumento intelligente che consente all’utente di ricevere indicazioni pratiche per pianificare un viaggio. Si tratta del template dell’assistente di viaggio conversazionale adattato per l’utilizzo con la lingua italiana.

Blocchi Voiceflow

Con Voiceflow, è possibile acquisire gli input dell’utente e passarli ai modelli generativi (LLM) che più si prediligono. È sufficiente trascinare dal menu principale sulla sinistra un blocco AI quindi impostarne le specifiche preferenze.

Il vantaggio di una piattaforma come Voiceflow è che ogni input o risposta può essere memorizzato all’interno di una variabile. Il suo nome può essere scelto arbitrariamente quindi recuperato in seguito all’interno di qualunque punto del flusso di lavoro.

Scelta modello generativo IA

Dati aziendali e indirizzi remoti per addestrare il modello, con un clic

È interessante notare che scegliendo l’opzione Knowledge Base, è possibile passare all’intelligenza artificiale di Voiceflow una serie URL e di documenti aziendali che saranno utilizzati per le attività di addestramento del modello. Ciò che si ottiene è un chatbot o un assistente vocale “cuciti” sulla base delle esigenze di ogni singola realtà aziendale.

Così facendo, costruendo il flusso di lavoro con i blocchi più appropriati, è possibile fare in modo che l’applicazione Web generata con Voiceflow risponda a domande specifiche delle attività svolte dall’azienda, sui suoi prodotti, sulle loro caratteristiche, sugli aspetti salienti di ogni realtà business, senza scomodare i LLM generalisti. Poco adatti in alcuni campi applicativi.

L’opzione Knowledge Base apre di fatto le porte all’approccio RAG (Retrieval-Augmented Generation), un modello che combina tecniche di recupero e generazione per produrre contenuti in linea con le aspettative dell’azienda.

Modalità di test e debug integrati

Prima di essere implementato, ogni progetto può essere testato direttamente all’interno della piattaforma. È possibile simulare conversazioni e valutare il comportamento dell’assistente vocale o del chatbot nei vari scenari, per identificare e correggere eventuali errori o problemi di flusso.

Cliccando sul triangolino “Play” posto a sinistra del blocco Start di colore verde, è possibile eseguire le attività impostate l’una dopo l’altra. Ciascun utente è comunque libero di provare il funzionamento di singoli blocchi: ciascuno di essi contiene un piccolo pulsante “Play”.

I blocchi devono ovviamente essere interconnessi l’uno con l’altro per definire le operazioni da eseguire in successione.

Come utilizzare le funzioni

Cliccando su Library, API Call Example, è possibile fare in modo che Voiceflow effettui delle chiamate GET o POST verso servizi di terze parti oppure propri, gestiti su server dedicati e sistemi cloud. Utilizzando le variabili, si possono definire i dati da trasmettere alle API e gestire l’output ricevuto, diversificando il comportamento del flusso in caso di successo o fallimento dell’operazione.

Libreria chiamate API Voiceflow

Le funzioni di Voiceflow sono una gemma davvero preziosa: sebbene l’idea sia quella di creare bot conversazionali senza mettere mano al codice, gli sviluppatori possono inserire routine articolate che ricevono valori in ingresso mediante variabili e ne restituiscono in uscita.

Esempi di integrazioni già utilizzabili con Voiceflow, sono disponibili nell’apposita area del sito. Purtroppo, la soluzione che consente di far dialogare Voiceflow con i modelli vocali, anche personalizzati, disponibili su Eleven Labs non sembra funzionare al momento. Neppure inserendo l’API key corretta di Eleven Labs, parametri come il testo da leggere e l’identificativo del modello vocale da utilizzare.

Integrazione Eleven Labs modello vocale Voiceflow

Peccato perché creare un ponte tra Voiceflow ed Eleven Labs significherebbe avere la possibilità di attivare un motore text-to-speech (TTS), capace di leggere in maniera efficace e coinvolgente (anche in italiano), qualunque testo generato dagli LLM più noti.

D’altra parte, la funzione Voice Lab di Eleven Labs consente di creare un modello vocale a partire dalla registrazione della voce di qualunque persona (assicuratevi di aver raccolto la sua liberatoria per procedere in tal senso). Bastano pochi secondi di parlato per ottenere un modello eventualmente interoperabile tramite API con Voiceflow.

Voci personalizzate modello Eleven Labs

Conclusioni

Voiceflow rappresenta un’innovazione significativa nel campo della progettazione delle interfacce conversazionali, consentendo a individui e imprese di creare esperienze utente avanzate senza la necessità di competenze di programmazione avanzate.

Con la sua interfaccia Web intuitiva, la capacità di integrare servizi esterni e il supporto per la collaborazione in tempo reale (più utenti dello stesso team possono concorrere a sviluppare un flusso di lavoro), Voiceflow si posiziona come una risorsa indispensabile per chiunque desideri capitalizzare le potenzialità dei moderni modelli generativi.

I professionisti possono usare Voiceflow per la creazione di assistenti vocali utili a gestire le richieste dei clienti e fornire supporto in tempo reale. Ma si può sfruttare la piattaforma anche per supportare l’apprendimento degli studenti attraverso interazioni vocali, implementare assistenti vocali per guidare gli utenti attraverso il processo di acquisto nei siti di e-commerce e per fornire informazioni sui prodotti.

Suggeriamo anche di non perdere d’occhio il changelog di Voiceflow: aiuta a scoprire tutte le funzionalità via via aggiunte alla piattaforma.

Creare un assistente vocale con Voiceflow e l'intelligenza artificiale

Cos’è e come creare un chatbot o un assistente vocale con Voiceflow

Dati aziendali e indirizzi remoti per addestrare il modello, con un clic

Modalità di test e debug integrati

Come utilizzare le funzioni

Conclusioni

Ti consigliamo anche

Intel rilancia anche con i nuovi SoC Panther Lake e Nova Lake per i veicoli

Adobe, svolta Photoshop: nuovo agente AI e aggiornamenti Firefly

Gli occhiali smart di Ray-Ban Meta iniziano a diventare davvero utili

YouTube celebra 20 anni e introduce la riproduzione 4x