Quantcast
News

Nvidia rivoluziona le voci: l’IA in grado di imitare qualsiasi suono

Condividi l'articolo

Nvidia ha svelato un nuovo modello di intelligenza artificiale chiamato Fugatto (acronimo di Foundational Generative Audio Transformer Opus 1), progettato per la generazione di musica e audio. Questa tecnologia ha la capacità di modificare le voci e creare suoni originali, rivolgendo la sua attenzione a produttori di musica, film e videogiochi.

Nvidia, leader mondiale nella produzione di chip e software per sistemi di intelligenza artificiale, ha dichiarato di non avere piani immediati per il rilascio pubblico di Fugatto. Questo modello si unisce a tecnologie simili presentate da startup come Runway e da aziende consolidate come Meta Platforms, che possono generare audio e video a partire da input testuali.

Caratteristiche di Fugatto

La versione di Nvidia, con sede a Santa Clara, California, è in grado di generare effetti sonori e musica a partire da descrizioni testuali. Tra i suoni innovativi creati da Fugatto, si trova persino l’originale abbaiare di una tromba che imita il verso di un cane. Ciò che distingue questa tecnologia è la sua abilità di modificare audio esistente: per esempio, può trasformare una melodia suonata al pianoforte in una cantata eseguita da una voce umana o alterare l’accento e l’umore di una registrazione vocale.

Bryan Catanzaro, vicepresidente della ricerca applicata sul deep learning di Nvidia, ha dichiarato: “Negli ultimi 50 anni, l’audio sintetico ha evoluto il modo in cui ascoltiamo la musica, grazie ai computer e ai sintetizzatori. Credo che l’intelligenza artificiale generativa porterà nuove possibilità non solo nella musica e nei videogiochi, ma anche per chiunque desideri creare contenuti”.

Leggi anche:

Le preoccupazioni sul futuro dell’IA nell’intrattenimento

Mentre aziende come OpenAI negoziano con gli studi di Hollywood sull’uso dell’intelligenza artificiale nel settore dell’intrattenimento, il rapporto tra tecnologia e Hollywood è diventato teso. Recentemente, l’attrice Scarlett Johansson ha accusato OpenAI di aver imitato la sua voce, sollevando interrogativi sull’uso etico di tali tecnologie.

Nvidia ha sviluppato Fugatto utilizzando dati open source e sta attualmente valutando come e se rilasciarli al pubblico. Catanzaro ha avvertito: “Qualsiasi tecnologia generativa comporta dei rischi, poiché potrebbe essere utilizzata per creare contenuti indesiderati. È fondamentale procedere con cautela, ed è per questo che non abbiamo piani immediati per il rilascio”.

La necessità di regolamentazioni

I creatori di modelli di intelligenza artificiale generativa stanno ancora cercando soluzioni per prevenire l’abuso della tecnologia, come la diffusione di informazioni errate o la violazione di diritti d’autore attraverso la creazione di personaggi protetti. Anche OpenAI e Meta non hanno fornito indicazioni sui tempi di rilascio dei loro modelli generativi di audio e video.

Con Fugatto, Nvidia si propone di rivoluzionare il panorama audio, ma è chiaro che la discussione su come gestire e regolamentare queste tecnologie è appena iniziata.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Ti è piaciuta questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
0 0 votes
Article Rating

Rispondi

0 Commenti
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x