Meta rilascia un modello di AI in grado di trascrivere e tradurre quasi 100 lingue

22 Agosto 2023 GuruHiTech 499 Views 0 Comments algoritmo, intelligenza artificiale, meta, SeamlessAlign, SeamlessM4T, traduzione

Condividi l'articolo

Nel suo impegno per lo sviluppo di intelligenza artificiale in grado di comprendere una gamma di dialetti diversi, Meta ha creato un modello di intelligenza artificiale chiamato SeamlessM4T, che può tradurre e trascrivere quasi 100 lingue sia nel testo che nel parlato.

Disponibile in open source insieme a SeamlessAlign, un nuovo set di dati per la traduzione, Meta sostiene che SeamlessM4T rappresenta una “significativa svolta” nel campo della traduzione vocale e testuale basata sull’IA.

“Nostro singolo modello fornisce traduzioni su richiesta che consentono a persone che parlano lingue diverse di comunicare in modo più efficace”, scrive Meta in un post sul blog condiviso con TechCrunch. “SeamlessM4T riconosce implicitamente le lingue di origine senza la necessità di un modello separato di identificazione delle lingue”.

SeamlessM4T rappresenta in qualche modo l’erede spirituale di No Language Left Behind di Meta, un modello di traduzione di testo in testo, e di Universal Speech Translator, uno dei pochi sistemi di traduzione diretta del parlato che supporta la lingua Hokkien. E si basa su Massively Multilingual Speech, la struttura di Meta che fornisce tecnologie di riconoscimento vocale, identificazione delle lingue e sintesi del parlato in oltre 1.100 lingue.

Leggi anche:

L’intelligenza artificiale risolve i captcha prima e meglio degli esseri umani

Meta non è l’unico ad investire risorse nello sviluppo di strumenti sofisticati di traduzione e trascrizione basati sull’IA.

Oltre alla moltitudine di servizi commerciali e modelli open source già disponibili da Amazon, Microsoft, OpenAI e numerose startup, Google sta creando ciò che chiama Universal Speech Model, parte del più ampio sforzo del colosso tecnologico per sviluppare un modello in grado di comprendere le 1.000 lingue più parlate al mondo. Mozilla, d’altro canto, ha avviato Common Voice, una delle più grandi collezioni multilingue di voci per l’addestramento di algoritmi di riconoscimento automatico del parlato.

Tuttavia, SeamlessM4T è uno degli sforzi più ambiziosi finora per combinare le capacità di traduzione e trascrizione in un singolo modello.

Per svilupparlo, Meta afferma di aver estratto dati pubblicamente disponibili (nell’ordine di “decine di miliardi” di frasi) e registrazioni vocali (4 milioni di ore) dal web. In un’intervista con TechCrunch, Juan Pino, uno scienziato di ricerca della divisione di ricerca sull’IA di Meta e un collaboratore del progetto, non ha rivelato le fonti esatte dei dati, affermando solo che ce ne erano “diverse”.

Non tutti i creatori di contenuti sono d’accordo con la pratica di utilizzare dati pubblici per addestrare modelli che potrebbero essere utilizzati a fini commerciali. Alcuni hanno intentato cause legali contro le aziende che costruiscono strumenti di intelligenza artificiale basati su dati pubblicamente disponibili, sostenendo che i fornitori dovrebbero essere obbligati a fornire attribuzione, se non compensazione, e modi chiari per decidere di non partecipare.

Tuttavia, Meta afferma che i dati da essa estratti, che potrebbero contenere informazioni personalmente identificabili, non erano coperti da copyright e provenivano principalmente da fonti open source o con licenza.

Segui guruhitech su:

Google News: bit.ly/gurugooglenews
Telegram: t.me/guruhitech
Facebook: facebook.com/guruhitechweb
Twitter: twitter.com/guruhitech1
Instagram: instagram.com/guru_hi_tech/
Threads: threads.net/@guru_hi_tech
GETTR: gettr.com/user/guruhitech
Rumble: rumble.com/user/guruhitech
VKontakte: vk.com/guruhitech
MeWe: mewe.com/i/guruhitech
Skype: live:.cid.e496a29c3d8dfd2
WhatsApp: bit.ly/whatsappguruhitech

Esprimi il tuo parere!

Che ne pensi di questo nuovo modello AI di Meta? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo guruhitech@yahoo.com.

(Visited 100 times, 1 visits today)

L	M	M	G	V	S	D
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Meta rilascia un modello di AI in grado di trascrivere e tradurre quasi 100 lingue

Leggi anche:

Leggi anche:

Ti potrebbe interessare:

Segui guruhitech su:

Esprimi il tuo parere!

Mi piace:

Correlati

RispondiAnnulla risposta