L’IA generativa Stable Diffusion si aggiorna ancora una volta, ma nella sua versione XL. Mentre gli utenti più “smanettoni” possono ancora utilizzare Stable Diffusion 2.0, versione rilasciata da Stability AI verso fine 2022, coloro che sono iscritti alla beta di Stable Diffusion XL possono scaricare la versione 0.9 per provare le ultime novità nella generazione di immagini da prompt testuali.
L’annuncio dell’aggiornamento arriva direttamente dalla società statunitense, che garantisce l’accesso al modello tramite ClipDrop a partire da oggi, 23 giugno 2023. La prima versione aperta dovrebbe invece arrivare a metà luglio con il passaggio alla iterazione 1.0, permettendo a coloro che hanno una moderna GPU consumer (soprattutto NVIDIA) di generare immagini iperrealistiche per film, televisione, musica e video didattici, oltre a modelli per il design e l’uso industriale. Ancora una volta, SDXL si pone in prima linea nelle applicazioni per le immagini AI.
Stability AI aggiorna Stable Diffusion XL
L’update in questione mostra chiari passi in avanti rispetto alla precedente versione di SDXL Beta. L’update 0.9, come potete vedere anche dall’immagine in copertina, permette di creare immagini molto più realistiche e ricche di dettagli, offrendo anche una gamma di funzionalità che si estendono oltre i suggerimenti testuali di base. Questi includono il prompt da immagine a immagine (inserimento di un’immagine per ottenere variazioni di quell’immagine), inpainting (ricostruzione di parti mancanti di un’immagine) e outpainting (costruzione di un’estensione continua di un’immagine esistente).
Il fattore chiave di questo avanzamento per SDXL 0.9 è il significativo aumento dei parametri su cui viene addestrato il modello, rispetto alla versione beta. Si parla, infatti, di una base di 3,5 miliardi di parametri da immagini open source, per un potenziale di 6,6 miliardi. SDXL 0.9 viene eseguito su due modelli CLIP, incluso uno dei più grandi modelli OpenCLIP addestrati fino ad oggi (OpenCLIP ViT-G/14), che potenzia la potenza di elaborazione e garantisce la capacità di creare immagini realistiche con maggiore profondità e una risoluzione più elevata di 1024×1024.
SDXL 0.9 può essere eseguito su sistemi con Windows 10, 11 o Linux, 16 GB di RAM, scheda grafica Nvidia GeForce RTX 20 (equivalente o superiore) dotata di minimo 8 GB di VRAM, o anche AMD da 16 GB di VRAM per utenti Linux. Il modello è ora disponibile su Clipdrop, mentre i clienti di Stability AI API e DreamStudio potranno accedervi da lunedì 26 giugno. Inizialmente resterà disponibile solo per scopi di ricerca, prima della diffusione gratuita su Github.