In passato abbiamo parlato della nota tecnica che permette di sostituire volti in un video usando l’intelligenza artificiale. I deepfake utilizzano algoritmi di apprendimento profondo, in particolare reti neurali artificiali, per manipolare il contenuto di immagini e intere sequenze filmate in modo realistico.
Uno strumento come Human Generator consente di creare immagini di persone e modellare il corpo umano mentre Fooocus si spinge ancora più avanti utilizzando i modelli generativi per ritoccare le foto e generare nuove opere modificando singoli elementi dell’immagine originale, viso compreso.
Come creare un fotomontaggio con Chirper
Tra le piattaforme più promettenti in assoluto c’è Chirper, un chatbot che utilizza modelli generativi open source per generare immagini a partite dai prompt degli utenti, semplici o articolati che siano, in inglese, in italiano o in altre lingue.
Per impostazione predefinita, Chirper attiva l’opzione Turn on prompt fix (l’icona della bacchetta magica a destra del campo che riceve l’input). Si tratta di uno strumento che tende a modificare il prompt per renderlo più in linea con i modelli generativi utilizzati.
Durante le nostre prove, abbiamo avuto modo di verificare che Chirper predilige le illustrazioni: disattivando l’opzione Turn on prompt fix, di solito si ottiene anche la generazione di foto. Cliccando sulle immagini prodotte dall’intelligenza artificiale, si può accedere a una serie di informazioni: il nome del modello utilizzato, la tipologia dell’immagine, il prompt inserito dall’utente e la versione impostata da Chirper e il prompt negativo. Quest’ultimo contiene una serie di esclusioni impostate per migliorare il risultato finale ed evitare l’inserimento, nelle immagini proposte all’utente, di elementi indesiderati.
Chirper utilizza modelli generativi open source derivati dalla piattaforma Hugging Face. Come spesso avviene, tuttavia, anche Chirper spesso genera immagini imperfette. Le mani, ad esempio, sono strutture anatomiche molto complesse, con articolazioni e movimenti intricati. Non è raro che possa spuntare qualche dito in più o le mani siano ritratte in posizioni assolutamente innaturali. Le mani possono assumere una vasta gamma di pose e configurazioni. La variabilità nelle posizioni delle dita, degli arti e delle orientazioni delle mani rende complessa la generazione di immagini coerenti. I modelli devono essere addestrati su un ampio spettro di dati per catturare queste diversità e, ancora oggi, si rilevano comunque le difficoltà delle IA che sfruttano dataset realistici e di qualità.
Scegliere l’immagine da usare per il fotomontaggio
Ciò che differenzia Chirper rispetto ad altri tool basati sull’uso di modelli generativi, è la possibilità di intervenire su proprie foto. Per creare un fotomontaggio basta infatti cliccare sull’icona a sinistra del campo Describe the image in a few words quindi fare clic su Upload image per selezionare un’immagine dal dispositivo in uso.
Chirper mostra un messaggio che richiede all’utente di confermare la piena disponibilità del diritto d’autore sull’immagine in questione. In altre parole, non è possibile utilizzare foto create da altri soggetti senza una loro esplicita autorizzazione. È pacifico che non è ammesso caricare foto di celebrità o di altre persone reali senza aver preventivamente acquisito il loro consenso.
Per mostrare le potenzialità dell’applicazione, nell’esempio che segue abbiamo utilizzato un’immagine di una persona che non esiste, in quanto a sua volta prodotta dall’intelligenza artificiale (link).
Ad upload del volto ultimato, abbiamo inserito il prompt “girl dancing on the beach” ottenendo le immagini riprodotte in figura.
Gli aspetti sui quali porre attenzione
Quando si utilizzano servizi online che automatizzano i fotomontaggi, è comunque sempre bene dare un’occhiata ai termini di uso del servizio e alla policy sulla privacy. Nel caso di Chirper, la società australiana che ha sviluppato questo potente strumento basato sull’IA, precisa che il copyright sulle foto caricate resta dei legittimi proprietari, quindi dell’utente stesso (che dichiara di possedere i diritti di utilizzo) ma spiega che il materiale caricato online può essere utilizzato per addestrare il modello generativo e migliorarne le prestazioni.
Inoltre, l’azienda si avvale di una licenza che l’utente accorda a Chirper nel momento in cui inizia a utilizzare il servizio e mantiene un account attivo. Il tutto è descritto nella pagina termini di utilizzo.
Per evitare il trasferimento di dati su piattaforme cloud facenti capo a vari soggetti, l’approccio migliore consiste nell’utilizzare i modelli generativi in locale attrezzandosi con un PC dotato della configurazione hardware più adatta. Nell’articolo su Fooocus citato nell’introduzione, si consiglia l’uso di un computer dotato di GPU NVidia RTX serie 4000 con almeno 4 GB di VRAM a bordo.
In ogni caso, a parte le imperfezioni che possono occasionalmente comparire nelle foto generate dall’IA e che hanno a che fare con la morfologia del corpo umano, siamo di fronte a strumenti avanzati capaci di metterci dinanzi a una certezza: ciò che vediamo, ascoltiamo o leggiamo – anche se apparentemente originale e aderente al reale – può essere frutto di un’elaborazione digitale.
Credit immagine in apertura: iStock.com – da-kuk