FakeApp, cos'è e come funziona in breve l'app per creare video fasulli

Grazie ai suoi algoritmi di deep learning, FakeApp riconosce i volti presenti nei video e permette di sostituirli con i visi di altre persone. Ecco come funziona.
FakeApp, cos'è e come funziona in breve l'app per creare video fasulli

In questi giorni si è fatto un gran parlare di FakeApp, un’applicazione scritta in Java che è nata per gioco ma che dimostra come anche i video, a breve, possano essere facilmente manipolati.

FakeApp pone una vera e propria pietra miliare perché dimostra come utilizzando il deep learning (vedere Intelligenza artificiale, cos’è e qual è la differenza con il machine learning) sia possibile modificare un volto raffigurato in un video sostituendolo con il viso di un’altra persona.

I video sono composti da frame, immagini che combinate assieme formano una sequenza filmata. Cosa succederebbe se un software o meglio un’intelligenza artificiale riuscisse a riconoscere il volto di una stessa persona, sostituendolo con le immagini di un altro soggetto? Che una persona potrebbe essere ritratta in pose in cui non si è mai posta e compiere azioni mai realizzate davvero.

Il bello (o il brutto, a seconda dei punti di vista…) di FakeApp è che il programma riconosce e sostituisce i volti servendosi di hardware di media potenza, quale può essere quello che compone i PC generalmente utilizzati dai videogiocatori.
Inoltre, le immagini del volto sono dinamiche e ciò che si ottiene è un surrogato del video originale, una versione falsa che però – soprattutto nelle realizzazioni meglio riuscite – sembra davvero ritrarre un’altra persona.

Il video che proponiamo di seguito sembra ritrarre l’attrice britannica Daisy Ridley. In realtà il corpo non è il suo: il suo viso, con le varie espressioni, è stato sovrapposto a quello di un altro soggetto proprio usando FakeApp.


Per usare FakeApp, al momento ospitata sui server MEGA, è necessario un PC equipaggiato con una scheda grafica NVidia, i driver CUDA 8.0 e il noto software FFmpeg.
Dopo aver “addestrato” FakeApp proponendogli i volti dei due soggetti (quello presente nel video originale e quello da sostituire), l’applicazione procederà con l'”assemblaggio” e la produzione del filmato finale.

Certo, per arrivare a ottenere risultati di qualità è necessario tanto impegno e molta pazienza ma l’autore di FakeApp ha dimostrato concretamente ciò che si può fare con la sua “creatura”.

La chiave di volta risiede nella scelta di immagini “compatibili” con il video sul quale si desidera intervenire.
FakeApp usa certamente la tecnica chiamata HOG (Histogram of oriented gradients) o istogramma di gradienti orientati: si tratta di un meccanismo sfruttato nella computer vision e nell’elaborazione delle immagini per il riconoscimento automatico degli oggetti. La tecnica conta le occorrenze dell’orientamento del gradiente in porzioni localizzate di un’immagine. In altre parole verifica come sono disposti i pixel in un’immagine esaminandone le caratteristiche comuni.


Confrontando le informazioni raccolte con un archivio di immagini, è possibile raccogliere quelle che sono simili e hanno caratteristiche comparabili.
Utilizzando poi operazioni come convolution e pooling, vere e proprie pietre miliari nelle applicazioni per il deep learning, le immagini vengono classificate ed è possibile selezionare quelle che consentiranno di ottenere il risultato migliore.
Il meccanismo è gestito mediante l’uso di autoencoder capaci di codificare una rappresentazione delle immagini utilizzabili per comporre il video finale.

In futuro non bisognerà avere fiuto solamente per le fake news (Fake news: cosa sono, come riconoscerle e perché sono diventate un problema), non si dovranno sviluppare solamente abilità nel riconoscimento dei fotomontaggi (ne abbiamo parlato nello stesso articolo sulle fake news) ma si dovrà essere sempre più critici e dubbiosi anche rispetto all’attendibilità dei video pubblicati in rete.
Se FakeApp è in grado di produrre video dalla qualità davvero stupefacente, figurarsi che cosa è possibile ottenere con hardware più potente e soprattutto sfruttando la potenza delle risorse condivise sul cloud dai vari provider come Google, Amazon e Microsoft.

Ti consigliamo anche

Link copiato negli appunti