Quantcast
News

MGIE, l’IA di Apple che modifica immagini da descrizioni testuali

Condividi l'articolo

Apple ha presentato MGIE, un’innovazione nell’intelligenza artificiale di uso gratuito che permette di modificare le immagini attraverso semplici istruzioni scritte. Questo progresso è stato raggiunto grazie alla collaborazione con l’Università della California a Santa Barbara.

Il sistema di Apple si basa su ciò che viene chiamato “editing guidato delle immagini“. Ciò significa che, utilizzando tecnologie avanzate in grado di comprendere testo e immagini (conosciute come modelli linguistici multimodali di grandi dimensioni), MGIE è in grado di interpretare ciò che una persona richiede e modificare un’immagine in dettaglio, pixel per pixel.

Ad esempio, se l’utente chiede all’IA di “rendere il cielo più blu” in una foto, MGIE comprenderà questa istruzione e modificherà l’immagine per soddisfare la richiesta.

Come funziona MGIE

I ricercatori spiegano che a volte le istruzioni che le persone danno sono molto brevi e dirette, il che rende difficile la loro comprensione da parte dei sistemi attuali.

Tuttavia, i modelli di grandi dimensioni che comprendono sia testo che immagini (MLLM) mostrano un grande potenziale per interpretare e rispondere a queste istruzioni attraverso l’editing visuale.

Leggi anche:

MGIE, il metodo sviluppato, lavora in due modi con questi MLLM. Prima di tutto, prende le istruzioni scritte dall’utente e le traduce in comandi più dettagliati e specifici che facilitano l’editing.

Ad esempio, se qualcuno desidera che l’erba in una foto sembri più verde, MGIE potrebbe comprendere questo come “aumentare del 20% la saturazione del verde nell’area corrispondente all’erba”. Questo comando chiaro viene utilizzato per modificare l’immagine.

Successivamente, in un secondo passaggio, utilizza questi modelli avanzati per generare un’idea visiva precisa di come dovrebbe apparire la modifica finale.

Questo processo crea una guida per regolare l’immagine, modificando ogni pixel come necessario. In questo modo, MGIE può apportare modifiche specifiche a istruzioni molto brevi o ambigue senza bisogno di molte informazioni aggiuntive e fornendo risultati che soddisfano la richiesta dell’utente.

Secondo i creatori, questo sistema migliora significativamente la precisione delle modifiche e la soddisfazione degli utenti, mantenendo un processo rapido ed efficiente.

Come provare MGIE

Il modello di intelligenza artificiale più recente di Apple, noto come MGIE, è stato condiviso su GitHub, consentendo l’accesso pubblico al codice sorgente, ai dati utilizzati per addestrare l’algoritmo, alle versioni già addestrate e a una guida per l’utilizzo in diverse situazioni di editing.

Questo passo consente a chiunque interessato di esplorare e sperimentare con questa tecnologia.

Per coloro che desiderano provare MGIE senza immergersi nei dettagli tecnici, è stata resa disponibile una dimostrazione online su Hugging Face Spaces, un sito web specializzato nell’offrire prove di strumenti di intelligenza artificiale.

Ciò consente l’integrazione di MGIE nelle applicazioni esistenti che necessitano di modificare immagini o creare contenuti visivi in modo automatico.

Questa scommessa sull’intelligenza artificiale segna una nuova era nella tecnologia dei consumatori, dove strumenti come MGIE non solo promuovono l’innovazione, ma promettono anche di trasformare il modo in cui gli utenti interagiscono con i loro dispositivi.

Leggi anche:

Anche se MGIE è nato come un progetto di ricerca e non è ancora stato annunciato il suo inserimento diretto nei prodotti o servizi di Apple, questo lancio sottolinea l’interesse dell’azienda nel rafforzare la sua posizione nel campo dell’intelligenza artificiale.

Di recente, Apple ha presentato MLX, un altro algoritmo destinato a semplificare la progettazione di modelli di apprendimento automatico.

L’importanza che Apple attribuisce all’intelligenza artificiale è emersa dalle dichiarazioni di Tim Cook, il CEO, che ha menzionato lo sviluppo di nuove capacità di IA generativa che si prevede saranno introdotte nel corso dell’anno.

Gli esperti prevedono che queste innovazioni verranno integrate in iOS 18, segnando un’evoluzione significativa per Siri, l’assistente virtuale dell’azienda.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Ti piace questa nuova intelligenza artificiale di Apple? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo guruhitech@yahoo.com.

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
(Visited 41 times, 1 visits today)
0 0 votes
Article Rating

Rispondi

0 Commenti
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x