Deepfake video: come crearli da soli con l'intelligenza artificiale di Roop

Presentato su GitHub il progetto Roop: basato su Python permette di sfruttare eventualmente l'accelerazione lato GPU per creare deepfake video di qualità a partire dall'immagine di un solo volto.
Deepfake video: come crearli da soli con l'intelligenza artificiale di Roop

I moderni modelli generativi sono ampiamente sfruttati nel campo dell’intelligenza artificiale per creare contenuti nuovi a partire dalle informazioni fornite in input che vengono combinate con i dati trasferiti nella fase di addestramento. Questi modelli utilizzano tecniche di apprendimento automatico, in particolare il deep learning, per creare nuovi dati che possano essere considerati “creativi”.

Un deepfake video è un contenuto manipolato con l’intelligenza artificiale creato a partire da un altro video e rimaneggiato in maniera tale da sembrare attendibile. In un altro articolo abbiamo visto cos’è un deepfake e come questa tecnica viene comunemente utilizzata per generare immagini fasulle. Il nome deepfake deriva dalla combinazione delle parole deep learning e fake (falso).

Su GitHub è stato presentato il progetto Roop, uno strumento evoluto che poggia il suo funzionamento sull’intelligenza artificiale portando all’estremo il concetto di deepfake video. Il modello alla base di Roop, infatti, non ha bisogno di un periodo di addestramento, non necessita di un dataset di ampie dimensioni fornito dall’utente e, soprattutto, richiede solamente un’immagine in ingresso.

Roop consente di elaborare un video preesistente e sostituire il volto di una persona con quello di un’altra: per procedere, oltre al video “target”, è necessaria solo un’unica immagine del volto della persona da inserire nella sequenza filmata.

Vengono fornite le istruzioni per procedere in totale autonomia: l’installazione di base è molto lenta perché non permette di sfruttare la potenza di calcolo della GPU. Viceversa, applicando le istruzioni generali quindi le indicazioni per abilitare l’accelerazione grafica, l’elaborazione video risulterà molto più rapida e si potranno risolvere gli eventuali problemi incontrati nel rendering del deepfake.

L’esecuzione del comando python run.py porta alla comparsa della finestra principale di Roop, simile a quella riprodotta in figura.

Deepfake video Roop

Per procedere, basta cliccare il pulsante Select a face, scegliere l’immagine raffigurante il volto da inserire nel video quindi selezionare il video o l’immagine di destinazione. Cliccando su Start, Roop avviare il processo di generazione del deepfake.

In Windows si può aprire Esplora file quindi portarsi all’interno della cartella indicata per la memorizzazione del video finale: qui si trova una directory dal nome corrispondente a quello del video e all’interno di essa i frame elaborati in tempo reale.

Roop fornisce anche un’interfaccia da riga di comando che può essere utilizzata per dialogare con il software usando comandi testuali. In particolare:

-f SOURCE_IMG, --face SOURCE_IMG può essere utilizzato per specificare l’immagine da inserire nel video
-t TARGET_PATH, --target TARGET_PATH per indicare il video o l’immagine da elaborare
-o OUTPUT_FILE, --output OUTPUT_FILE per specificare il file da ottenere
--keep-fps per mantenere i frame per secondo originali
--gpu per richiedere l’utilizzo della GPU
--keep-frames per evitare la cancellazione della cartella “di appoggio” contenente i frame via via generati

Nella pagina ufficiale GitHub di Roop sono pubblicati alcuni esempi di deepfake video realizzati con lo strumento: a sinistra come si presentava il video originale, a destra il video derivato con l’aggiunta dell’immagine indicata dall’utente.

Non è sempre semplice riconoscere i deepfake ben realizzati: per questo Intel ha recentemente presentato il suo sistema FakeCatcher.

Ti consigliamo anche

Link copiato negli appunti