Grazie alla collaborazione con l’Università della California, Apple ha potuto rilasciare un nuovo ed interessante modello IA in grado di effettuare interventi di “fotoritocco testuale“, ovvero modifiche alle immagini attraverso semplici input testuali.
Il modello in questione è noto come MGIE (ovvero MLLM-Guided Image Editing) e può interagire a diversi livelli con una qualunque immagine. Per esempio, attraverso prompt, è possibile intervenire su oggetti specifici presenti in una foto, cambiando la forma degli stessi o modificandone la luminosità.
A rendere MGIE unico nel suo genere è il fatto che combina l’utilizzo di due modelli linguistici multimodali diversi. Uno di essi è utile per interpretare gli ordini dell’utente e il secondo per “immaginare” il risultato della modifica che si appresta ad eseguire.
A prescindere da questi tecnicismi, il risultato di questo connubio è chiaro: anche senza intervenire con app specifiche di fotoritocco, non accessibili a tutti, chiunque potrà eseguire modifiche a foto e immagini.
MGIE potrebbe essere l’antipasto di ciò che ha in serbo Apple per i suoi clienti
Come riportato da VentureBeat, Apple ha reso MGIE disponibile tramite GitHub per il download, rilasciando anche una demo Web su Hugging Face. Nonostante ciò, almeno al momento, il colosso di Cupertino non ha svelato particolari progetti futuri o evoluzioni di MGIE.
Sebbene questo progetto risulti interessante, va tenuto conto che non è una novità assoluta. Già altre piattaforme, come DALL-E 3 di OpenAI, svolgono operazioni di fotoritocco attraverso input di testo. In tal senso, va ricordato che anche Adobe ha applicato l’Intelligenza Artificiale all’editing di immagini, con Firefly.
Anche se non rivoluzionario, questo nuovo strumento dimostra ancora una volta come Apple abbia finalmente considerato la sua entrata in scena nel contesto dell’IA. Dopo le conferme di Tim Cook, infatti, MGIE appare con un ulteriore passo in tal senso da parte della compagnia.