Quantcast
News

La nuova rete neurale di Google è in grado di parlare, ascoltare e tradurre

Condividi l'articolo

L’ultima novità di Google nel campo delle tecnologie AI è il modello linguistico multimodale AudioPaLM. Questo modello è in grado di elaborare e generare sia contenuti testuali che discorsi: la rete neurale non solo è in grado di comunicare oralmente nella lingua scelta, ma anche di effettuare traduzioni con alta precisione.

AudioPaLM è stato creato combinando le potenzialità del grande modello linguistico PaLM-2 e del modello audio generativo AudioLM. Il primo si specializza nell’analisi delle conoscenze linguistiche, mentre il secondo è capace di identificare il parlante e di riconoscere l’intonazione.

Leggi anche:

Secondo i creatori, l’algoritmo AI ha la capacità di tradurre da una lingua all’altra sulla base di una breve indicazione orale, e può anche convertire il discorso in testo per coppie di lingue sconosciute in precedenza senza la necessità di formazione preliminare.

In aggiunta alla generazione di discorsi, AudioPaLM può creare trascrizioni nella lingua originale o direttamente in forma di traduzione. Inoltre, il modello linguistico è in grado di memorizzare informazioni paralinguistiche come la personalità del parlante e la sua intonazione. La data di lancio commerciale del nuovo AI sarà annunciata in seguito.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Che ne pensi di questa nuova rete neurale di Google? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
0 0 votes
Article Rating

Rispondi

0 Commenti
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x