Nelle ultime ore OpenAI ha annunciato il lancio di una nuova funzione per ChatGPT Plus, chiamata Advanced Voice Mode, ovvero la tanto attesa modalità vocale avanzata. Questa implementazione permetterà agli utenti delle sottoscrizioni a pagamento di ChatGPT di interagire con il chatbot attraverso conversazioni vocali estremamente naturali.
Come dimostrato in fase di presentazione, la modalità vocale avanzata permette all’utente di interrompere la stessa durante la conversazione, oltre a reagire in maniera verosimile alle emozioni degli utenti. Allo stato attuale la nuova funzione è disponibile solo a un ristretto numero di tester, con OpenAI ha prevede una disponibilità per tutti gli utenti ChatGPT Plus entro il prossimo autunno.
La modalità vocale avanzata si basa su GPT-4o e rappresenta un aggiornamento importante per quanto riguarda i sistemi conversazionali finora utilizzati da ChatGPT. In passato, infatti, il tutto si limitava a un semplice sistema di conversione voce-testo. La presentazione di questa funzionalità era nell’aria da tempo, con la startup di Sam Altman che aveva presentato la stessa al pubblico lo scorso mese di maggio.
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
La modalità vocale avanzata di OpenAI, il caso Sky e i test esterni
Grazie a GPT-4o è stato possibile ampliare il processo di ricezione di input audio, consentendo al chatbot di rispondere quasi come se fosse un’altra persona.
Nonostante l’annuncio sia avvenuto poche ore fa, in realtà le intenzioni di OpenAI erano di lanciare questa funzione molto prima. A intralciare i piani della compagnia è stato il disguido legato a Sky, la voce che avrebbe dovuto essere utilizzata per questo strumento. La stessa è stata infatti giudicata sospettosamente simile a quella dell’attrice Scarlett Johansson che, dopo alcune proteste, ha spinto OpenAI a cambiare strategia.
Le tempistiche prolungate, inoltre, sono figlie anche dei test che la startup ha portato avanti per proporre un sistema raffinato e soprattutto sicuro. OpenAI ha infatti affermato di aver testato la modalità vocale avanzata con oltre 100 organizzazioni esterne, coinvolgendo realtà che parlano ben 45 lingue diverse.