Già in occasione del lancio di PaLM e Gemini, nel corso dello scorso anno, Google ha sottolineato come la sua Intelligenza Artificiale era da considerarsi come “multimodale“.
Ciò, tradotto in parole semplici, significa che l’IA del colosso di Mountain View può generare tanto testo quando immagini, audio e video. Proprio con questa premessa nasce VideoPoet, una piattaforma creata da Google proprio per generare filmati attraverso input testuali. Sebbene siano stati effettuati tentativi simili in passato, questo strumento sembra rappresentare un punto di svolta nel rapporto tra IA e video, grazie alle sue capacità impressionanti.
Google VideoPoet è un modello sperimentale di large language model (LLM) attraverso cui è possibile descrivere testualmente una scena e ottenere in risposta un video pronto da guardare in pochi secondi. Chi ha già provato sistemi simili ma applicati a semplici immagini, come Midjourney o DALL-E 3, può immaginare come lavora questa piattaforma.
Con Google VideoPoet, l’IA comincia a fare sul serio quando si tratta di generazione video
VideoPoet è inoltre in grado di interagire con contenuti video già esistenti, ritagliando parte dei fotogrammi e modificando la parte mancante. Come è facile intuire, le potenzialità di questa nuova tecnologia sono pazzesche.
Come già accennato, lo strumento ideato da Google non è il primo della sua categoria. Dunque perché VideoPoet è considerato così rivoluzionario?
L’anno scorso, lo stesso colosso informatico, ha proposto Phenaki. Meta, dal canto suo, ha presentato Make-A-Video. Nessuno dei due modelli, però, è stato rilasciato pubblicamente.
Non solo: questi hanno spesso palesato, nei rari test mostrati al pubblico, efficacia solo con brevi movimenti e che in molti casi appaiono innaturali o grotteschi. VideoPoet, invece, nasce proprio per una gestione ottimizzata dei movimenti, con filmati proposti più lunghi (allo stato attuale si parla di 8-10 secondi di video).
Quando sarà disponibile e quanto costerà VideoPoet?
Sebbene Google abbia già pubblicato dozzine di video di esempio per dimostrare i punti di forza della nuova piattaforma, non ha ancora annunciato l’effettivo lancio. In altre parole, non sappiamo quando sarà possibile effettivamente mettere le mani su VideoPoet.
Per quanto riguarda i potenziali prezzi, l’unica possibile indicazione potrebbero essere i generatori di immagini già esistenti come Midjourney, disponibili solo tramite abbonamento. In effetti, le immagini e i video generati dall’IA richiedono uno sforzo di risorse non trascurabile e dunque, per forza di cose, dovrebbe trattarsi di un servizio a pagamento.
Per avere maggiori informazioni a riguardo però, non ci resta che attendere comunicazioni da parte di Google.