Un altro passo verso la creazione di perfetti avatar di noi stessi
Facebook sta sviluppando una nuova tecnologia chiamata PIFuHD in grado di creare modelli di figure umane in 3D partendo da una foto. L’algoritmo utilizza una rete neurale per identificare il soggetto della foto e isolarlo dallo sfondo, ma è anche in grado di ricreare la parte posteriore del soggetto.
PIFuHD sta per Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization (Funzione implicita del pixel allineato per la digitalizzazione umana in 3D ad alta risoluzione). PIFuHD si basa sul precedente sistema chiamato Pixel-Aligned Implicit Function (PIFu) e su una rete neurale a livelli gerarchici. La rete neurale tiene conto del contesto globale e locale dell’immagine che le permette di raggiungere un’elevata accuratezza nella costruzione del modello 3D finale.
L’architettura consiste in 2 livelli di moduli PIFu:
- Un livello base che si concentra sull’estrarre le caratteristiche generali di un’immagine, simile e al modello PIFu;
- Un livello di perfezionamento che si focalizza sull’estrarre informazioni sul contesto e sull’aggiunta di dettagli più precisi al modello 3D.
Facebook ha mostrato per la prima volta l’interesse nel ricreare copie digitali di esseri umani già nel marzo del 2019 con “Codec Avatars”. Questo progetto si focalizzava principalmente sulla testa e il volto, utilizzando scansioni di 132 fotocamere per generare l’avatar di una persona. Utilizzando la rivoluzionaria tecnologia di acquisizione 3D e l’intelligenza artificiale, Codec Avatars potrebbe fare in modo che le persone in futuro possano creare i propri avatar virtuali con le proprie sembianze, in modo semplice e veloce, garantendo che interazioni sociali, nella realtà virtuale, diventino naturali e comuni come quelle del mondo reale.
Nel maggio del 2019, la società ha poi mostrato una funzione di tracciamento del corpo in tempo reale e senza l’utilizzo di marcatori, con un grado di fedeltà senza precedenti, usando un modello che tiene conto sia della muscolatura umana sia del sistema scheletrico.
Normalmente, la tecnica di tracciamento ad esempio utilizzata per i film (motion capture), ha bisogno di alcuni marcatori di riferimento che verranno poi utilizzati nelle applicazioni 3D per creare un modello basato su tali movimenti, ma in questo caso l’I.A. non ha bisogno di alcun punto di riferimento.
La creazione del corpo dell’avatar è un altro passo verso l’obiettivo di permettere agli utenti di esistere nel mondo virtuale così come lo sono nel mondo fisico.
Quest’ultimo sistema di machine learning però, è il risultato di tutti questi sistemi precedentemente sviluppati e permette di tracciare il corpo umano, isolarlo dallo sfondo tramite anche solo una foto e di ricrearne la parte posteriore.
Così, una volta che questa tecnologia sarà disponibile per tutti, il suo utilizzo non sarà relegato agli avatar per i videogame, ma potrà aprirsi a nuovi orizzonti, come ad esempio nel campo delle applicazioni per effetti speciali che magari ci permetteranno di usare un attore famoso nei nostri film (un po’ come in S1m0ne) o semplicemente saremo in grado di produrre un nostro film completamente da soli, interpretando tutti i personaggi in maniera più semplice.
Adobe dovrebbe cogliere l’opportunità e in futuro integrare questo sistema per le proprie applicazioni, come ad esempio Adobe After Effects.
Tuttavia, ci sono anche aspetti negativi, come il fatto che alcune persone potrebbero fingersi altre persone, per esempio via social e/o via video chiamata; o peggio, rubare la nostra identità. Quindi, questa tecnologia potrebbe diventare un altro mezzo per alimentare la cosiddetta società falsa (fake society).