Quantcast
News

Immagini che prendono vita: la nuova rivoluzione AI di Google

Condividi l'articolo

Gli ingegneri di Google hanno sviluppato una rivoluzionaria rete neurale chiamata VLOGGER, in grado di creare un video da una fotografia statica di una persona, dove la persona nel video parla e narra. In questo processo, vengono utilizzate anche registrazioni audio e sincronizzate con il personaggio che parla nel video.

“Il nostro obiettivo è creare un video fotorealistico di lunghezza variabile che ritrae accuratamente il discorso della persona target, includendo movimenti della testa, gesti e persino un controllo adeguato dello sguardo”, afferma il sito web del progetto.

Leggi anche:

Durante la generazione del video, la rete neurale tiene conto della traccia audio fornita per creare movimenti corporei appropriati, espressioni facciali, posture e per regolare lo sguardo del personaggio di conseguenza. Inoltre, permette la modifica delle espressioni facciali, come aprire o chiudere gli occhi e la bocca.

Una possibile applicazione di questa nuova tecnologia è l’adattamento dei video tradotti in diverse lingue. Spesso, nei film e nelle serie TV doppiate, c’è una discrepanza evidente tra l’audio parlato e i movimenti delle labbra. VLOGGER offre una soluzione a questo problema.

Per ulteriori esempi video e informazioni dettagliate su come funziona la rete neurale, visita questo sito.

Fonte

Ti potrebbe interessare:
Segui guruhitech su:

Esprimi il tuo parere!

Ti è piaciuta questa notizia? Lascia un commento nell’apposita sezione che trovi più in basso e se ti va, iscriviti alla newsletter.

Per qualsiasi domanda, informazione o assistenza nel mondo della tecnologia, puoi inviare una email all’indirizzo [email protected].

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
0 0 votes
Article Rating

Rispondi

0 Commenti
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
kk miner