La sorprendente evoluzione degli avatar digitali – Juventud Rebelde

La strada verso l’intelligenza artificiale ha molte biforcazioni. Uno di questi porta alla creazione di video iperrealistici, una tecnologia che viene perfezionata ad ogni presentazione da parte dei colossi del mercato.

Le espressioni sono quasi impeccabili. Poiché so che ciò che vedo non è “reale”, posso distinguere un movimento “strano” della bocca, un sorriso un po’ esagerato o un battito di ciglia “eccessivo”. Tuttavia, se avessi guardato i video senza sapere con cosa avevo a che fare, non avrei notato nulla. Sono semplicemente persone comuni che parlano di argomenti diversi. Solo che non sono persone, ma costrutti digitali generati dall’intelligenza artificiale, capaci di riprodurre la vita reale con inquietante fedeltà.

La scorsa settimana Microsoft ha rivelato una nuova intelligenza artificiale (AI), chiamata VASA-1, in grado di creare avatar umani iperrealistici da un’immagine e un file vocale.

Questa tecnologia può dare vita alle nostre fotografie, aggiungendo espressioni e sincronizzando il movimento delle labbra con la clip audio. È una sincronizzazione perfetta che ha fatto cantare il tema anche alla Gioconda di Leonardo. Paparazzidi Anne Hathaway, tra gli esempi di video rivelati da Microsoft.

Come funziona vasa-1

Secondo i ricercatori, VASA-1 cattura l’intera gamma delle espressioni umane, compresi i movimenti naturali della testa, per generare avatar parlanti davvero credibili. Ciò è possibile separando elementi come i tratti del viso, la posizione della testa e le espressioni, consentendo il controllo dettagliato di ciascun attributo e la possibilità di modificare il contenuto separatamente.

L’intelligenza artificiale di Microsoft utilizza un approccio 3D per catturare maggiori dettagli sul viso e su come si muove nello spazio tridimensionale. Il modello di diffusione accetta segnali aggiuntivi, come la direzione primaria dello sguardo e la distanza della testa, nonché le emozioni. Con la stessa traccia audio, VASA-1 può generare avatar felici, arrabbiati o nervosi, che cercano di avvicinarsi al realismo.

VASA-1 può produrre video di alta qualità con una risoluzione di 512×512 pixel a 45 fotogrammi al secondo. I ricercatori ne hanno evidenziato l’efficienza, poiché lo strumento può essere eseguito su un computer dotato di scheda grafica Nvidia RTX 4090.

L’intelligenza artificiale di Microsoft, che per ora è solo sperimentale e non disponibile al pubblico, non si limita alle vere e proprie fotografie, ma può essere applicata anche in illustrazioni o dipinti, come la già citata Monna Lisa. Gli avatar iperrealistici potrebbero rivoluzionare il modo in cui interagiamo nel mondo digitale.

Una tecnologia in ascesa

Se effettui una ricerca su Internet, scoprirai che esistono numerosi strumenti gratuiti per creare avatar utilizzando l’intelligenza artificiale, anche se molti forniscono risultati di dubbia qualità. Tuttavia, gli sforzi di Microsoft non sono gli unici a dare risultati sorprendenti.

A gennaio Google ha introdotto Lumiere, un’intelligenza artificiale per generare video dal testo. Lumiere si distingue per la sua architettura spazio-temporale, che le consente di generare intere clip in un unico passaggio, evitando l’incoerenza temporale vista nei modelli precedenti. Questa funzionalità è essenziale per ottenere fluidità e coerenza nei video che assomigliano sempre più alla realtà.

Inoltre, Lumiere semplifica il processo di editing video per gli utenti con poche conoscenze, consentendo di modificare parti specifiche con una semplice maschera e un comando di testo. È anche possibile generare “video stilizzati”—che estetico è molto di moda in questo momento, utilizzando un’immagine di riferimento, che fino ad ora ha rappresentato una sfida considerevole.

Intanto il 15 febbraio è arrivato Sora, uno strumento sviluppato da OpenAI che permette di generare video realistici a partire da una frase di testo. Con esso puoi dettagliare il movimento, l’ambientazione e la transizione delle scene, con una durata massima di un minuto.

Come GPT-4 o DALL-E 3, Sora utilizza il sistema di deep learning di reti neurali artificiali e strutture computazionali per apprendere da grandi quantità di dati e applicarli per creare cose completamente nuove. Sora si è allenato con tanti video e descrizioni per capire e imparare come funziona questo tipo di ambiente multimediale e applicarlo alle proprie creazioni.

VASA-1 è l’evoluzione di Sora e Lumiere, in quanto non utilizza testo, ma voci, per generare i suoi avatar.

Chiavi per capire

Due concetti essenziali per valutare le potenzialità delle intelligenze artificiali sono training e inferenza. Questi termini spesso passano inosservati, ma sono fondamentali per misurare la capacità di questi sistemi di funzionare al meglio.

La formazione è il primo aspetto da considerare. Si riferisce al volume di dati con cui l’IA è stata addestrata a creare cose nuove. Non costruisci nulla da zero, ma costruisci invece su ciò che hai imparato. Questo è qualcosa che sperimentano anche gli esseri umani, quando imparano a creare cose nuove. Maggiore è il volume di dati con cui è stata addestrata l’IA, più facile sarà per lei generare variazioni notevoli nel video generato.

Video generato con l’intelligenza artificiale Sora di OpenAI.

L’inferenza è l’altro aspetto fondamentale. Senza di essa, sarebbe molto difficile per l’intelligenza artificiale comprendere gli esseri umani e soddisfare con successo le nostre richieste. L’inferenza è la capacità di comprendere e aderire alle nostre richieste per soddisfarle con successo. Maggiore è la capacità di comprensione, più accurato sarà. Gli ingegneri dietro l’IA hanno un approccio chiaro: i modelli linguistici devono comprendere le nostre richieste, anche se ci spieghiamo male.

Sora pone però anche un problema: la difficoltà di distinguere tra un video reale e uno realizzato con l’intelligenza artificiale, come già avviene con le immagini. Questo apre la porta alla proliferazione di video falsi sui social network, che possono mostrare situazioni non realistiche con personaggi famosi. Pertanto, è importante che vi siano norme e limiti per l’uso di questa tecnologia.

Un problema in cantiere

Tuttavia, questo tipo di intelligenza artificiale presenta anche un lato pericoloso. Avatar e video iperrealistici potrebbero essere utilizzati per ingannare gli utenti. Detto questo, Microsoft si è dichiarata contraria a qualsiasi richiesta negativa e ha indicato che non pubblicherà questo strumento finché non sarà sicura che la sua tecnologia verrà utilizzata in modo responsabile.

«Ci ​​opponiamo a qualsiasi comportamento che crei contenuti fuorvianti o dannosi provenienti da persone reali e siamo interessati ad applicare la nostra tecnica per promuovere l’individuazione dei falsi. “Ci impegniamo a sviluppare l’intelligenza artificiale in modo responsabile, con l’obiettivo di promuovere il benessere umano”, ha affermato la società.

Nonostante le buone intenzioni di Microsoft – condivise anche da Google e OpenAI – la verità è che sono già sorte polemiche con modelli in grado di generare immagini. Ricordiamo l’anno scorso le foto false di Donald Trump mentre veniva arrestato e resisteva, di Papa Francesco che rappava o faceva il modello, o del presidente americano Joe Biden che litigava in una strada circondato da esplosioni e proiettili.

Tutti sono stati creati con Midjourney, uno strumento che ha eliminato il suo modello di accesso gratuito per evitare la proliferazione di notizie false. La verità è che in quest’era della post-verità, in cui dobbiamo dubitare di tutto ciò che vediamo, leggiamo o sentiamo, almeno finché non siamo sicuri che sia vero attraverso fonti affidabili, anche strumenti come VASA-1, Sora o Lumiere sono un allarme. dell’importanza delle nuove normative e dei limiti all’utilizzo di queste tecnologie.

 
For Latest Updates Follow us on Google News
 

-

PREV “Ho avuto fidanzati sieropositivi…”: Jordi Castell conduce una “lezione veloce” sull’educazione sessuale in un programma televisivo
NEXT Nel pieno dell’offensiva a Rafah, Israele e Usa hanno discusso di “azioni alternative” per “garantire la sconfitta” di Hamas