L’era dell’inganno

0
3
the age of deception

Quando l’IA può alterare la realtà

A partire dal 2020 l’intelligenza artificiale si è fatta sempre più strada nelle nostre vite. E abbiamo iniziato ad accorgecene quando sono comparsi i primi video deepfake: ossia la tecnica di sostituire i volti di un soggetto di un video o foto con quello di un altro volto, in modo pressoché perfetto, proprio grazie all’uso dell’intelligenza artificiale. Anche se la loro nascita ufficiale è precedente al 2020, il loro utilizzo si è man mano diffuso grazie anche allo sviluppo di strumenti che ne hanno sempre di più semplificato la creazione.

I deepfake hanno evidenziato subito uno dei problemi principali dell’intelligenza artificiale: il poter modificare e rendere credibili fotografie o video di fatti mai avvenuti.

Se sostituire i volti di attori famosi con altri soggetti per vederli come protagonisti dei film è apparsa subito come una cosa rivoluzionaria e divertente, vedere poi, la stessa tecnologia, applicata alla pornografia, ha generato subito scalpore e timore.

Molte donne famose si sono ritrovate protagoniste di video e foto pornografici inconsapevolmente e la cosa peggiore è stata poi dover smentire, nonostante l’evidente prova, di non c’entrare nulla con tutto ciò. Cionostante, molti continueranno a credere che molte di quelle foto o video siano reali dato che smentire un fatto non vero è sempre più difficile che crearlo.

I deepfake non hanno però fatto breccia solo nel campo pornografico, ma anche in quello politico potendo così rovinare facilmente l’immagine della vittima e di conseguenza veicolando anche l’opinione pubblica.

Ma era solo l’inizio. Infatti, ci siamo maggiormente preoccupati quando è stato presentato Google Duplex, un’IA che (seppur limitita nei suoi compiti) ha saputo dimostrare come tale tecnologia potesse facilmente comunicare al telefono per prendere appuntamenti senza che l’interlocutore se ne accorgesse; utilizzando pause, segnali discorsivi (senti, bene, dunque, …), interiezioni (ma, mmm, …), in modo da rendere più realistica la conversazione.

Tuttavia la vera rivoluzione è arrivata con GPT (Generative Pretrained Transformer) di OpenAI (un modello di intelligenza artificiale) che già nella sua seconda versione era riuscito a dimostrare di saper scrivere un articolo di giornale, mostrando una capacità di scrittura pari a quella di un essere umano. Ma lo stupore più grande è arrivato soprattutto con ChatGPT, il primo chatbot dotato di questa tecnologia che ci ha permesso di comunicare come se stessimo davvero parlando con un umano e potendogli chiedere praticamente qualunque cosa…

Ciononostante, molti si ricorderanno di un altro chatbot precedente a ChatGPT che già aveva dimostrato il potenziale dell’IA applicata ai chatbot, ossia Replika. Replika era nato come primo chatbot fondato sull’IA. L’idea nacque da un episodio spiacevole dell’ideatrice che avendo perso un’amico in un incidente decise di ideare un chatbot allenandolo a parlare come l’amico defunto attraverso i suoi messaggi. Una puntata di Black Mirror cita questo evento.
Tuttavia il fascino di IA come ChatGPT risiede più nella sua capacità predittiva che nel suo ragionamento. Infatti laddove le risposte sembrano il frutto di un ragionamento, sono invece il risultato di un calcolo probabilistico.

Ma la scrittura non è stata l’unica rivoluzione nel campo dell’IA, poiché soprattutto con DALL-E e poi Midjourney, l’IA ha iniziato a diventare capace di produrre arte a partire da una semplice descrizione, riuscendo così a replicare stili e tecniche di artisti famosi su idee di immagini totalmente nuove.
Anche in questo caso la vera creatività è un’illusione poiché nonostante i risultati eccezzionali, il tutto è sempre frutto dell’allenamento di un algoritmo su opere e tecniche già esistenti.

E se ciò non bastasse, non potevano mancare anche applicazioni nel campo delle voci. I vecchi generatori di sintesi vocali si sono evoluti molto grazie all’IA, tanto da produrre risultati molto naturali. Molte delle più recenti applicazioni hanno opzioni per modificare enfasi e tono, ma la rivoluzione più eclatante in questo campo è stata sicuramente la possibilità di clonare la voce umana e poterla usare come sintetizzatore vocale riuscendo incredibilmente a far dire alla voce clone qualunque cosa. Un primo tentativo di questo tipo era stato fatto dalla società Lyrebird poi inglobata in Descript.

La tendenza si è poi diffusa anche nel campo musicale infatti abbiamo iniziato a sentire molte cover di canzoni famose reinterpretate da altrettanti cantanti famosi grazie all’IA ponendo quindi un nuovo timore sulla possibilità di sostituire i cantanti facilmente e poter produrre canzoni con la voce di qualcun’altro senza permesso.

Le cose più preoccupanti sono però arrivate dopo, quando molti di questi campi di applicazione sono iniziati a convogliare in un unico strumento come ad esempio Heygen che si è subito diffuso per la sua capacità di produrre traduzioni audio da video, non solo mantendo il tono di voce originale, ma anche modificando di conseguenza il labiale del soggetto in modo da farlo coincidere col parlato. Così facendo si è creata l’impressione che il soggetto parlasse effettivamente quella lingua. La cosa ha creato scalpore soprattutto per quando riguarda il mondo del doppiaggio.

Il caso più estremo dell’applicazione di questo strumento è stato però il suo uso finalizzato a modificare ciò che normalmente può dire una persona. Se possiamo mantenere il tono di voce e modificare il labiale, possiamo creare un video ad hoc di una persona che potrebbe dire qualunque cosa che non abbia mai detto, mettendo così in dubbio ogni prova video e audio.

Ecco perché siamo entrati ufficialmente nell’era dell’inganno. Da oggi tutto ciò che vediamo o sentiamo proveniente da una foto, video o audio potrebbe essere manipolato. Si potrà far dire e far fare cose a chiunque con molta facilità. La verità diventerà sempre più sepolta.

Quale sarà però il passo successivo?

Se l’IA si evolve come sta avvenendo in modo esponenziale è difficile immaginarne i limiti, ma sicuramente inizieremo a vedere le conseguenze delle capacità di un’IA multimodale, capace di utilizzare ogni fonte: testo, immagini, video e suoni per interagire con noi, e dare risposte sempre più complesse come ChatGPT 4, Gemini di Google e successivi.

Successivamente arriverà l’IA generale (AGI) quando sarà in grado di eguagliare le capacità degli esseri umani. E la Super IA quando essa supererà le sue capacità.

Chissà come la società sarà cambiata in quel momento e quali conseguenze ci saranno state.