Nvidia rivoluziona le voci: l’IA in grado di imitare qualsiasi suono
Nvidia ha svelato un nuovo modello di intelligenza artificiale chiamato Fugatto (acronimo di Foundational Generative Audio Transformer Opus 1), progettato per la generazione di musica e audio. Questa tecnologia ha la capacità di modificare le voci e creare suoni originali, rivolgendo la sua attenzione a produttori di musica, film e videogiochi.
Nvidia, leader mondiale nella produzione di chip e software per sistemi di intelligenza artificiale, ha dichiarato di non avere piani immediati per il rilascio pubblico di Fugatto. Questo modello si unisce a tecnologie simili presentate da startup come Runway e da aziende consolidate come Meta Platforms, che possono generare audio e video a partire da input testuali.
Caratteristiche di Fugatto
La versione di Nvidia, con sede a Santa Clara, California, è in grado di generare effetti sonori e musica a partire da descrizioni testuali. Tra i suoni innovativi creati da Fugatto, si trova persino l’originale abbaiare di una tromba che imita il verso di un cane. Ciò che distingue questa tecnologia è la sua abilità di modificare audio esistente: per esempio, può trasformare una melodia suonata al pianoforte in una cantata eseguita da una voce umana o alterare l’accento e l’umore di una registrazione vocale.
Bryan Catanzaro, vicepresidente della ricerca applicata sul deep learning di Nvidia, ha dichiarato: “Negli ultimi 50 anni, l’audio sintetico ha evoluto il modo in cui ascoltiamo la musica, grazie ai computer e ai sintetizzatori. Credo che l’intelligenza artificiale generativa porterà nuove possibilità non solo nella musica e nei videogiochi, ma anche per chiunque desideri creare contenuti”.
Leggi anche:
Le preoccupazioni sul futuro dell’IA nell’intrattenimento
Mentre aziende come OpenAI negoziano con gli studi di Hollywood sull’uso dell’intelligenza artificiale nel settore dell’intrattenimento, il rapporto tra tecnologia e Hollywood è diventato teso. Recentemente, l’attrice Scarlett Johansson ha accusato OpenAI di aver imitato la sua voce, sollevando interrogativi sull’uso etico di tali tecnologie.
Nvidia ha sviluppato Fugatto utilizzando dati open source e sta attualmente valutando come e se rilasciarli al pubblico. Catanzaro ha avvertito: “Qualsiasi tecnologia generativa comporta dei rischi, poiché potrebbe essere utilizzata per creare contenuti indesiderati. È fondamentale procedere con cautela, ed è per questo che non abbiamo piani immediati per il rilascio”.
La necessità di regolamentazioni
I creatori di modelli di intelligenza artificiale generativa stanno ancora cercando soluzioni per prevenire l’abuso della tecnologia, come la diffusione di informazioni errate o la violazione di diritti d’autore attraverso la creazione di personaggi protetti. Anche OpenAI e Meta non hanno fornito indicazioni sui tempi di rilascio dei loro modelli generativi di audio e video.
Con Fugatto, Nvidia si propone di rivoluzionare il panorama audio, ma è chiaro che la discussione su come gestire e regolamentare queste tecnologie è appena iniziata.
Ti potrebbe interessare:
Segui guruhitech su:
- Google News: bit.ly/gurugooglenews
- Instagram: instagram.com/guruhitech_official
- Telegram: t.me/guruhitech
- Facebook: facebook.com/guruhitechweb
- Twitter: twitter.com/guruhitech1
- Threads: threads.net/@guruhitech_official
- Bluesky: bsky.app/profile/guruhitech.bsky.social
- GETTR: gettr.com/user/guruhitech
- Rumble: rumble.com/user/guruhitech
- VKontakte: vk.com/guruhitech
- MeWe: mewe.com/i/guruhitech
- Skype: live:.cid.d4cf3836b772da8a
- WhatsApp: bit.ly/whatsappguruhitech
Esprimi il tuo parere!
Ti è piaciuta questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.
Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].