Quantcast
News

See-2-Sound: l’IA che genera audio da immagini e video

Condividi l'articolo

I ricercatori dell’Università di Toronto hanno presentato una straordinaria rete neurale in grado di creare suoni corrispondenti a ciò che vede in un’immagine o in un video. Questa innovativa intelligenza artificiale, chiamata See-2-Sound, apre nuove prospettive per l’interazione tra audio e visuale.

Gli algoritmi alla base di See-2-Sound valutano gli oggetti presenti in una scena e determinano quali suoni sarebbero più appropriati per rappresentarli. Ad esempio, se l’IA individua degli alberi, genererà il fruscio delle foglie; se riconosce un gatto, produrrà il miagolio.

Per ciascuna delle potenziali sorgenti sonore viene creata una traccia audio dedicata. Queste vengono poi assemblate in una composizione spaziale, in modo da ricreare un paesaggio sonoro realistico e avvolgente.

Leggi anche:

Puoi ascoltare direttamente sul sito web di See-2-Sound alcuni esempi del lavoro di questa affascinante intelligenza artificiale. Inoltre, è disponibile una versione demo del modello AI sul portale Hugging Face, per chi volesse sperimentarla più da vicino.

Per gli appassionati, i ricercatori hanno pubblicato anche una dettagliata descrizione testuale dell’algoritmo e un repository su GitHub con il codice sorgente.

See-2-Sound rappresenta un passo avanti significativo nell’ambito dell’intelligenza artificiale applicata all’audio. Questa tecnologia apre la strada a nuove possibili applicazioni, dalla creazione di colonne sonore per film e videogiochi, fino all’arricchimento di esperienze di realtà virtuale e aumentata.

L’abilità di See-2-Sound nel generare suoni in sincronia con ciò che viene mostrato sullo schermo è davvero impressionante. Non vediamo l’ora di vedere come questa innovativa rete neurale verrà sfruttata dai creativi di tutto il mondo.

Puoi ascoltare esempi sul sito web della rete neurale e scaricare una versione demo del modello AI sul portale Hugging Face. Per gli appassionati sono inoltre disponibili una descrizione testuale dell’algoritmo e come anticipato, un repository su GitHub.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Ti è piaciuta questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
0 0 votes
Article Rating

Rispondi

0 Commenti
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x
kk miner