Nel mondo dell’intelligenza artificiale applicata alla generazione di immagini, la capacità di controllare e modificare in modo preciso e fluido le creazioni digitali è una delle sfide principali. Con l’introduzione di FLUX.1 Tools, BlackForestLabs compie un deciso balzo in avanti rispetto alla concorrenza. È finalmente possibile non soltanto generare immagini di alta qualità a partire da descrizioni testuali, ma anche modificarle in modo intuitivo, preciso e flessibile. Il set di strumenti AI FLUX.1 Tools si distingue per la sua capacità di adattarsi sia a esigenze artistiche che professionali, rendendo la modifica di immagini un’esperienza senza precedenti.
Cosa sono i FLUX.1 Tools per generare e modificare immagini con l’AI
Di FLUX.1 abbiamo parlato nei giorni scorsi presentando il nuovo chatbot Mistral AI Le Chat: ai fini della generazione di immagini, in precedenza non ancora possibile, lo strumento offerto dalla società francese si mette in evidenza per l’adozione di FLUX1.1 [pro], modello capace di produrre risulti in alta risoluzione, fino a 4 Megapixel, e di grande qualità visiva.
I modelli generativi appena presentati dagli esperti di BlackForestLabs, che hanno contribuito allo sviluppo del noto Stable Diffusion, offrono la possibilità di guidare e manipolare le immagini in modo più preciso, utilizzando descrizioni testuali, mappe di profondità, bordi Canny (vedere più avanti) e maschere binarie.
Ogni strumento integrato nei FLUX.1 Tools è progettato per facilitare un controllo maggiore durante il processo creativo, permettendo di intervenire su immagini già generate o reali, modificarle o espanderle in modo coerente con la composizione originale.
Gli strumenti per la modifica avanzate delle immagini
- FLUX.1 Fill: Un modello di inpainting e outpainting che consente di riempire o espandere un’immagine esistente utilizzando descrizioni testuali e maschere binarie.
- FLUX.1 Depth: Modelli che utilizzano mappe di profondità per mantenere la struttura dell’immagine durante le trasformazioni.
- FLUX.1 Canny: Modelli che sfruttano i bordi Canny per guidare le modifiche, preservando la struttura originale dell’immagine.
- FLUX.1 Redux: Un adattatore che permette di mescolare immagini e prompt testuali per creare variazioni e rifinire le creazioni grafiche.
FLUX.1 Fill: Inpainting e Outpainting all’avanguardia
Uno degli strumenti più potenti introdotti nel set FLUX.1 Tools si chiama FLUX.1 Fill. Si tratta di un modello che rivoluziona le tecniche di inpainting ed outpainting, delle quali abbiamo parlato nell’articolo dedicato a Fooocus, software di fotoritocco basato sull’AI che funziona in locale.
Il processo di inpainting comporta il riempimento di porzioni mancanti di un’immagine, mentre l’outpainting consente di estendere un’immagine oltre i suoi confini originali. FLUX.1 Fill non solo permette queste operazioni, ma le porta a un nuovo livello grazie a un algoritmo che integra le modifiche in modo fluido, mantenendo la coerenza stilistica e l’integrità della composizione.
FLUX.1 Fill si distingue per la capacità di effettuare inpainting senza errori visibili, permettendo di riempire aree mancanti di un’immagine in modo che l’integrazione con il contesto circostante sia perfetta. A differenza di altri strumenti come Ideogram 2.0 o FLUX-Controlnet-Inpainting, FLUX.1 Fill genera modifiche che sembrano parte integrante dell’immagine originale, piuttosto che aggiunte forzate.
I pesi del modello sono già disponibili su Hugging Face mentre il codice di inferenza è pubblicato su GitHub. In questo modo è possibile ospitarli in locale o sul cloud, oppure attendere l’adozione da parte dei vari tool AI disponibili online.
FLUX.1 Depth e FLUX.1 Canny, per modifiche di alta precisione
Un altro aspetto rivoluzionario di FLUX.1 Tools è la possibilità di ricorrere al cosiddetto condizionamento strutturale per il controllo preciso delle trasformazioni delle immagini. Grazie ai modelli FLUX.1 Depth e FLUX.1 Canny, gli utenti possono applicare modifiche a un’immagine mantenendo la sua struttura originale, utilizzando mappe di profondità o bordi Canny come guida.
Il primo dei due modelli sfrutta una mappa di profondità estratta da un’immagine per guidare i cambiamenti, garantendo che le modifiche rispettino la struttura tridimensionale dell’immagine stessa. Un aspetto particolarmente utile per la creazione di texture o la modifica di scene in modo che gli oggetti appaiano sempre coerenti con la profondità e la prospettiva originale.
L’algoritmo di Canny è un metodo di rilevamento dei bordi utilizzato nell’elaborazione delle immagini per identificare i contorni degli oggetti all’interno di un’immagine. Sviluppato da John F. Canny nel 1986, l’algoritmo è uno degli approcci più popolari e robusti per il rilevamento dei bordi, ed è ampiamente utilizzato in vari campi, come la visione artificiale, il riconoscimento delle immagini e la robotica.
Nel caso di FLUX.1 Canny, il sistema si avvale dell’algoritmo di Canny per rilevare e utilizzare i bordi di un’immagine come struttura guida per le modifiche. Diventa così possibile preservare l’integrità delle forme e delle linee durante la modifica dell’immagine, rendendolo uno strumento potente per attività come il restyling di immagini o la creazione di variazioni stilistiche senza compromettere le proporzioni.
La nota pubblicata da BlackForestLabs contiene tutti i riferimenti per scaricare e utilizzare i due nuovi modelli avanzati.
FLUX.1 Redux: variazione e restyling delle immagini
Infine, FLUX.1 Redux è uno strumento che permette di creare variazioni di immagini a partire da un’immagine di input, integrando in modo naturale modifiche stilistiche e di composizione. È lo strumento è ideale per chi desidera creare versioni differenti di una stessa immagine, modificandone piccole o grandi porzioni.
Le variazioni stilistiche o compositive di un’immagine possono essere richieste a partire da un’immagine di input e un prompt testuale.
Grazie ai FLUX.1 Tools è possibile spingersi oltre i confini del design e della creatività, avvalendosi di nuove concrete opportunità in molteplici settori e segmenti di mercato.
Le immagini nell’articolo sono di BlackForestLabs