Google presenta l'app Whisk per "remixare" immagini con l'AI

Whisk permette di abbinare tra loro più immagini per ottenere, grazie all'AI, una sorta di remix tra di esse.
Google presenta l'app Whisk per

Poche ore fa Google ha presentato un nuovo strumento per generare immagini tramite l’Intelligenza Artificiale chiamato Whisk.

La caratteristica unica di questa piattaforma sta nel fatto che, per creare contenuti, non si basa solo sugli input testuali. Whisk è in grado di combinare tra loro più immagini, creando una sorta di remix, con risultati che appaiono più che convincenti.

A livello pratico, l’utente può fornire indicazioni per quanto riguarda soggetto, scena e stile. Caricando immagini per ogni aspetto, l’AI unisce tutti gli input forniti, elaborando un risultato. Processo e risultati sono stati mostrati da Google, attraverso X e il suo canale ufficiale YouTube.

Whisk si appoggia a Gemini e Imagen 3 per combinare tra loro più elementi

Aspetto ancora più interessante è che l’utente può intervenire nuovamente sulla creazione di Whisk. Ciò è possibile tramite la funzione Refine (ovvero “Raffina“). Risulta dunque possibile modificare l’opera dell’AI, fornendo alla stessa delle indicazioni tramite prompt testuale.

Come spiegato da Jason Balridge di Google, Whisk si appoggia a Gemini per interpretare e gestire il testo, agendo poi con Imagen 3 per generare le immagini.

Questi ultimi giorni sono stati senza ombra di dubbio movimentati per Google, che ha confermato il suo desiderio di coprire un ruolo importante nel settore dell’AI presentando anche Veo 2, strumento che permette di generare video evitando allucinazioni e offrendo filmati più lunghi rispetto a tante altre soluzioni presenti sul mercato.

Ti consigliamo anche

Link copiato negli appunti