Anche le macchine possono inventare qualcosa di nuovo

L’immaginazione umana è incredibile. Si può iniziare a immaginare un elefante rosa e poi lo stesso elefante a pois che vola nel cielo. Come avviene tutto ciò? I neuroni del nostro cervello si attivano in modi diversi in base alle conoscenze di precedenti elementi che già conoscevamo.

Come esseri umani, è facile immaginare un oggetto con diversi attributi. Tuttavia, nonostante le scoperte nel campo delle reti neurali possano eguagliare o addirittura superare gli esseri umani in alcuni compiti, i computer faticano ancora ad avere la capacità unicamente umana dell'”immaginazione”.

Ora, un team di ricerca della USC ha sviluppato un’intelligenza artificiale che usa abilità simili a quelle umane per immaginare un oggetto mai visto prima con diversi attributi. Il documento, intitolato Zero-Shot Synthesis with Group-Supervised Learning, è stato pubblicato nella 2021 International Conference on Learning Representations il 7 maggio.

“Ci siamo ispirati alle capacità umane di visualizzazione per cercare di simulare l’immaginazione umana nelle macchine”, ha affermato l’autore principale dello studio Yunhao Ge, uno studente del dottorato in informatica che lavora sotto la supervisione di Laurent Itti, un professore di informatica.

“Gli esseri umani possono separare le loro conoscenze apprese per attributi, per esempio: forma, posizione, colore, e poi ricombinarle per immaginare un nuovo oggetto. Il nostro studio tenta di simulare questo processo utilizzando reti neurali”.

È facile per noi immaginare una mela rossa e un’auto blu e poi prendere l’auto e applicarvi il colore della mela. Ora, questo può essere simulato con le reti neurali.

In generale, le reti neurali generano nuove immagini utilizzando quelle che gli vengono fornite, ma normalmente tendono a considerare l’immagine nel suo insieme piuttosto che estrarre elementi specifici.

>>>  Internet ladra del tempo

Ora l’obiettivo è di avere un’I.A. che possa estrapolare attributi specifici e applicarli a una vasta gamma di nuovi esempi mai visti prima.

Disentanglement

In questo nuovo studio, i ricercatori tentano di superare questa limitazione usando un concetto chiamato disentanglement che può essere usato per generare deepfakes, per esempio, separando i movimenti del viso e l’identità.

Facendo questo, ha spiegato Ge, “la gente può sintetizzare nuove immagini e video che sostituiscono l’identità della persona originale con un’altra persona, ma mantenendo il movimento originale”.

In modo simile, questo nuovo approccio prende un gruppo di immagini campione, piuttosto che un campione alla volta come hanno fatto gli algoritmi tradizionali, e sfrutta la somiglianza tra loro per ottenere qualcosa chiamato controllable disentangled representation learning.

Poi, ricombina questa conoscenza per ottenere una sintesi di nuove immagini controllabili (controllable novel image synthesis), o ciò che si potrebbe chiamare immaginazione.

Per farlo, hanno usato il Group-Supervised Learning (GLS), un processo di machine learning per scomporre gli input in diversi elementi che possono essere ricombinati per creare un nuovo oggetto.

Per esempio, prendiamo immagini di diversi caratteri: con diverse lettere, colori, sfondi, dimensioni, e con diversi stili; scomponiamo i diversi elementi e poi combiniamo queste immagini per ottenerne una nuova dove abbiamo ottenuto un nuovo carattere dalla combinazione degli elementi precedenti.

font disentanglement

Usando la loro tecnica, il gruppo ha generato un nuovo set di dati contenente 1,56 milioni di immagini che potrebbe aiutare la futura ricerca nel campo.

Sebbene il disentanglement non sia un’idea nuova, i ricercatori affermano che la loro struttura può essere compatibile con quasi tutti i tipi di dati o conoscenze. Tutto ciò amplia notevolmente l’opportunità di possibili applicazioni.

>>>  Cloud Valley: la città cinese controllata dall'Intelligenza Artificiale

Nel campo della medicina, potrebbe aiutare medici e biologi a scoprire farmaci più utili, separando la funzione del farmaco da altre proprietà per poi ricombinarle e sintetizzare in uno nuovo. Infondere l’immaginazione alle macchine potrebbe anche aiutare a creare un’intelligenza artificiale più sicura, per esempio, permettendo ai veicoli autonomi di immaginare ed evitare scenari pericolosi che non erano mai stati visti durante l’addestramento.

L’immagine seguente mostra un esempio di come avviene il disentanglement.

disentanglement
Disentanglement di una sedia

Nell’immagine seguente, un altro esempio di disentanglement con una sedia.

disentanglement of a chair

Data una forma in input (a), il codice geometrico e il codice della struttura vengono estratti. Mantenendo fisso uno di essi, viene generato un campione casuale (b). Per la prima riga di (b), il codice geometrico è mantenuto invariato. E, per la seconda riga, il codice della struttura viene mantenuto invariato mentre viene generato un campione casuale.

L’immaginazione sembrava essere una delle uniche capacità umane che un’intelligenza artificiale non potesse simulare. Tuttavia, questi nuovi studi ci fanno capire come l’I.A. possa raggiungere e superare capacità esclusivamente umane. Cosa ci rimarrà?

Raggiungeremo un altro livello di consapevolezza grazie alle risposte che l’A.I. ci darà? Ci concentreremo più sulle cose spirituali che sul materialismo, dato che l’A.I. automatizzerà la nostra routine quotidiana? Se la risposta sarà: vivere meglio insieme perché ci concentreremo più sulle relazioni che sulle cose, forse sarà una prospettiva positiva. Se no, potremmo essere solo schiavi della tecnologia per vivere senza empatia.

Fonte thebrighterside.com