A inizio luglio Stable Diffusion XL 1.0 è diventato disponibile per test preliminari su Discord, promossi dalla startup Stability AI al fine di confermare il corretto funzionamento del modello IA prima della diffusione a livello globale. Oggi, invece, 27 luglio 2023, la società ha annunciato ufficialmente il debutto di Stable Diffusion XL 1.0 open source su GitHub, tramite API di Stability, all’interno delle applicazioni per consumer Clipdrop e DreamStudio, e su Amazon Bedrock, il servizio di Amazon Web Services che offre l’accesso ai modelli IA più importanti del mercato.
Stable Diffusion XL 1.0 è disponibile
Stability AI definisce Stable Diffusion XL 1.0 “la versione più avanzata fino ad oggi” del modello text-to-image proprietario, disponibile gratuitamente per tutti gli sviluppatori e creator che vogliono cimentarsi nella realizzazione di immagini e composizioni artistiche a partire da semplici stringhe di testo. Le differenze chiave rispetto a Stable Diffusion riguardano i colori, le ombre e l’illuminazione, caratteristiche rappresentate con una maggiore precisione e naturalezza.
Secondo quanto affermato da Joe Penna, responsabile dell’apprendimento automatico di Stability AI, l’iterazione 1.0 contiene 3,5 miliardi di parametri e può produrre immagini con risoluzione completa di 1 megapixel “in pochi secondi” in più proporzioni.
Con l’elevata personalizzazione è ancora più semplice da utilizzare e può realizzare progetti complessi anche con suggerimenti elementari. In più, l’IA è molto più accurata nella generazione del testo nelle immagini. Ciò significa che loghi e parole scritte in una immagine generata da IA saranno più leggibili. Infine, la versione 1.0 supporta inpainting (ricostruzione di parti mancanti di un’immagine), outpainting (estensione di immagini esistenti) e prompt “image-to-image”.
Non mancano dilemmi morali relativi alla creazione di deepfake e contenuti pericolosi per la società e persino lo stesso Penna conferma che l’abuso non va escluso ed è possibile. Tuttavia, Stability AI è già al lavoro per mitigare la generazione di immagini dannose filtrando il database sul quale Stable Diffusion XL è stato addestrato.