A fine febbraio 2024, Stability AI ha annunciato la disponibilità del suo nuovo modello Stable Diffusion 3, per la generazione di immagini di alta qualità. Si tratta di un’intelligenza artificiale che, stando a quanto emerso a valle di una serie di test svolti da persone “in carne ed ossa”, porta alla creazione di immagini maggiormente fedeli alla descrizione e con una resa migliore rispetto, ad esempio, a modelli quali DALL-E 3 e Midjourney v6.
La nuova architettura Multimodal Diffusion Transformer (MMDiT) utilizza set di pesi separati per le rappresentazioni dell’immagine e del linguaggio, migliorando la comprensione del testo e le capacità ortografiche rispetto alle precedenti versioni di Stable Diffusion.
Cosa comporta la disponibilità delle nuove API per Stable Diffusion 3
Le API (Application Programming Interfaces) rappresentano l’interfaccia che gli sviluppatori possono utilizzare per dialogare in tempo reale con il modello attraverso le loro applicazioni.
Stability AI ha confermato che da oggi i programmatori possono servirsi delle nuove API, in grado di supportare Stable Diffusion 3 e Stable Diffusion 3 Turbo. Questa pagina contiene tutte le istruzioni per iniziare a dialogare sin da subito con le API di Stable Diffusion e integrarle liberamente nei propri progetti.
Ma non è finita qui. Se da un lato il modello è disponibile tramite API già fin da ora, i tecnici Stability AI stanno lavorando per migliorarlo in vista del suo rilascio aperto. L’impegno è infatti quello di mettere nelle mani degli interessati gli strumenti che permettano di sviluppare e trarre vantaggio da un’intelligenza artificiale generativa aperta. I pesi del modello saranno ad esempio resi disponibili nel breve termine.
Nell’apprendimento automatico e nell’intelligenza artificiale, il concetto di “pesi del modello” si riferisce ai parametri interni appresi durante il processo di addestramento su un insieme di dati specifico. Questi pesi rappresentano le connessioni tra i neuroni nelle reti neurali artificiali, regolati iterativamente durante l’addestramento del modello per migliorarne le prestazioni.
Parlando di generazione di testi in linguaggio naturale o di immagini, i pesi del modello includono le informazioni apprese dal modello durante la fase di addestramento e in particolare contengono le “chiavi” su come trasformare i dati in input negli output che l’utente si attende di ottenere.
Stability AI permetterà insomma di ospitare il modello sui propri server, con la possibilità di usare il modello in modo autonomo, senza dover accedere a una piattaforma esterna, e di personalizzarne il comportamento.
L’importante partnership con Fireworks AI
Con il preciso obiettivo di fornire agli utenti una soluzione API di grado enterprise, che garantisca una disponibilità del servizio del 99,9% – essenziale per le aziende che si affidano alla piattaforma Stability AI per sviluppatori al fine di gestire i carichi di lavoro generativi IA più impegnativi -, l’azienda ha stabilito una solida partnership con Fireworks AI.
Fireworks AI è una società di intelligenza artificiale che ha sviluppato una piattaforma di apprendimento automatico per aiutare le aziende ad automatizzare e ottimizzare i processi di business. La piattaforma utilizza algoritmi avanzati di apprendimento automatico per analizzare grandi quantità di dati e fornire previsioni accurate, insight e raccomandazioni.
Stability AI stessa descrive Fireworks AI come la piattaforma API più veloce e affidabile sul mercato.
Sicurezza e uso responsabile dell’intelligenza artificiale generativa
Con il lancio delle più recenti “declinazioni” di Stable Diffusion, sono state adottate ulteriori misure per rilevare e prevenire l’abuso dei modelli generativi da parte di utenti malintenzionati.
La sicurezza, si spiega Stability AI, inizia quando comincia la fase di addestramento del modello e prosegue durante il testing, la valutazione e l’implementazione. Collaborando continuamente con ricercatori, esperti e con l’intera comunità, presto debutteranno ulteriori novità incentrate proprie sull’implementazione e l’utilizzo responsabile.
“Con Stable Diffusion 3, ci sforziamo di offrire soluzioni adattabili che consentano a individui, sviluppatori e aziende di liberare la loro creatività, in linea con la nostra missione di sbloccare tutto il potenziale di ogni essere umano“, si legge nella nota ufficiale.
Per maggiori informazioni, suggeriamo di fare riferimento alla Stability AI Developer Platform.