Eleven Labs presenta un generatore di voci basato sull'intelligenza artificiale: come funziona

Questa voce non esiste: così comincia il post condiviso da Eleven Labs per descrivere il nuovo modello generativo capace di creare voci del tutto nuove, con la possibilità di personalizzarne tutti i parametri.

Un’intelligenza artificiale generativa è una IA capace di creare contenuti nuovi e originali, come testi, immagini e suoni. Gli algoritmi di apprendimento automatico permettono di generare nuovi contenuti invece di classificare o riconoscere informazioni già esistenti.
Un modello di intelligenza artificiale generativa potrebbe essere addestrato su un set di foto e quindi generare nuove immagini che sembrano realistiche ma che non esistevano prima.

È quello che fanno ad esempio Stable Diffusion e DALL-E mentre il chatbot ChatGPT si occupa di generare nuovi testi avviando un’interlocuzione con l’utente.
Nel corso di quest’anno sentiremo parlare di modelli che possono aiutare gli utenti a disegnare e a creare video.

In un altro articolo abbiamo parlato delle caratteristiche della voce e di come modificare la voce gratis con Windows.

Eleven Labs ha presentato un modello generativo che consente invece di progettare da zero voci artificiali completamente nuove. In altre parole, è possibile generare voci personalizzate che non corrispondono a nessuna voce esistente.

Il modello descritto da Eleven Labs consente di impostare alcuni parametri di base che stabiliscono l'”identità” della nuova voce: genere, età, accento, tono e stile.
La funzione “Design Voice” sarà disponibile a partire da febbraio 2023: per adesso gli interessati vengono invitati a richiedere l’iscrizione al programma beta.

Gli autori di libri ora ottengono non solo l’opportunità di convertire facilmente il proprio lavoro in audio ma mantengono anche il controllo artistico sulla progettazione di “narrazioni su misura”.

Gli editori che si occupano di contenuti testuali hanno adesso una scelta infinita di voci esclusive per rappresentare con il parlato le loro pubblicazioni: molti ascoltatori apprezzano la forma oltre che la sostanza. Con l’invenzione di Eleven Labs gli editori possono essere certi che una particolare voce li rappresenti, e rappresenti solamente loro.

Gli sviluppatori di videogiochi possono dare voce molto facilmente ai loro personaggi, “spendibili” anche nel metaverso.

I creativi pubblicitari hanno spesso bisogno di voci fuori campo per varie campagne: poter utilizzare voci di qualità mai “sentite” prima è un passo in avanti che non ha prezzo.

Ti consigliamo anche

Link copiato negli appunti