Il nuovo algoritmo di OpenAI è incredibilmente spaventoso

Nel gennaio 2021, OpenAI ha presentato DALL-E, un sorprendente algoritmo in grado di generare disegni e immagini da semplici istruzioni testuali. Nel 2022, il loro ultimo algoritmo, DALL-E 2, può generare immagini più realistiche e accurate con una risoluzione 4 volte maggiore.

L’algoritmo DALL-E 2 di OpenAI è in grado di trasformare un semplice testo in una vera e propria opera d’arte. Non c’è limite, solo l’immaginazione dell’utente.

Ciò che è impressionante è che il sistema di I.A. riconosce dove posizionare un elemento in un’immagine e cosa sia un’immagine fotorealistica, compresa la capacità di aggiungere e rimuovere elementi tenendo conto di ombre, riflessi e texture, ma anche facendo variazioni della stessa immagine.

In questo primo esempio DALL-E ha creato queste immagini dalle seguenti descrizioni combinando concetti, attributi e stili: “Un astronauta che si rilassa in un resort tropicale nello spazio in uno stile vaporwave” e “Un astronauta che gioca a basket con i gatti nello spazio come in una illustrazione di un libro per bambini”.

In questo secondo esempio, DALL-E ha posizionato il fenicottero in tre posti diversi tenendo conto delle ombre, dei riflessi e delle texture per ogni posizione.

Nel terzo esempio, DALL-E ha preso la prima immagine originale come ispirazione per farne una variazione nella seconda.

Il nome dell’algoritmo è una combinazione del nome dell’artista spagnolo Salvador Dalí e del personaggio Pixar WALL-E. In ogni caso, DALL-E 2 sta suscitando sentimenti contrastanti: alcuni sono stupiti e altri sono spaventati dal suo potenziale. La capacità dello strumento di convertire accuratamente i messaggi di testo in grafica è davvero notevole.

>>>  Comprendere il linguaggio naturale non è facile per l'I.A.

Come è possibile? Secondo OpenAI, un processo chiamato “diffusione” parte da un modello di punti casuali e altera gradualmente quel modello verso un’immagine quando rileva caratteristiche specifiche di quell’immagine. Attraverso questo processo, DALL-E 2 ha “imparato la relazione tra le immagini e il testo utilizzato per descriverle”.

È anche interessante vedere come gli utenti possano cercare di ingannare le capacità di riconoscimento del modello identificando un oggetto (come una mela Smith) con un nome che denota qualcos’altro (come un iPod). Nonostante l’alta probabilità di previsione che si avrebbe con questa didascalia, l’algoritmo genera comunque foto di mele con un’alta probabilità, anche quando si usa un’immagine etichettata male, e non produce mai foto di iPod.

DALL-E apple labeled ipod

Al momento, lo strumento non è disponibile al pubblico, ma è possibile iscriversi a una lista d’attesa per richiedere di essere inclusi in un gruppo di utenti selezionati che possono testare l’algoritmo.

Tuttavia, OpenAI è preoccupata per un possibile cattivo uso di questo strumento, quindi hanno fatto in modo che non possa generare volti reali, o creare immagini NSFW come immagini violente, di odio o per adulti.

Shiba Inu dog wearing a beret and black turtleneck
Immagine dalla descrizione: “Cane Shiba Inu con berretto e dolcevita nero”. Foto di OpenAI.

Questi strumenti di I.A. possono essere visti come un’opportunità per creare nuove forme d’arte, mescolando tecniche esistenti con la tecnologia, ma per alcuni questi algoritmi rappresentano una minaccia per gli artisti in quanto il rischio è quello di essere completamente sostituiti da una I.A. Inoltre, un’altra paura sta nel potenziale inganno nel generare foto che potrebbero rappresentare qualcosa di falso, ma che non si potrebbe riconoscere come tale.

Fonte creativityblog.org