IA trasforma schizzi in paesaggi

La G.A.N. di Nvidia crea una nuova forma d’arte

Il nuovo prototipo software della Nvidia è capace di trasformare in paesaggi dei semplici scarabocchi. È ancora lontana dall’essere perfetta, ma è davvero stupefacente come possa ricreare bellissime ambientazioni con atmosfere oniriche, partendo solo da qualche semplice pennellata molto stilizzata.

Usando una nuovo modello di IA chiamata Generative Adversarial Network (GAN), il software fornisce agli utenti ciò che Nvidia chiama “pennello intelligente”. In questo modo, si può delineare un semplice schizzo di una scena per poi colorarlo con erba, nuvole, foreste, mare o rocce.

Questo software non è esattamente nuovo, poiché i ricercatori avevano già mostrato qualcosa di simile in passato, incluso l’esempio di Google che riusciva a trasformare gli scarabocchi in disegni, ma questo è l’esempio più accurato in cui si mostra questo concetto. Il software genera dei paesaggi tramite Intelligenza Artificiale istantaneamente, e sono sorprendentemente intuitivi. Bisogna solo cliccare su ciò che si vuole dipingere (cielo, mare, nuvole, erba, ecc…), dare delle pennellate, ed esse diventeranno subito una foto realistica.

Un esempio di foto generata dalla GAN

Nella demo, si possono usare 3 strumenti: il pennello (per disegnare), il secchiello (per riempire un’area), e un contagocce (per campionare un colore). Si può poi anche scegliere un’immagine di partenza tra quelle rese disponibili, oppure se ne può caricare una a piacere. Inoltre, si può caricare una mappa di segmentazione (un disegno che rappresenta come dovrebbe essere suddivisa la scena che si vuole ottenere), o un’immagine che faccia da filtro (ossia un suggerimento sullo stile che l’IA dovrebbe adottare per il risultato finale).

Tuttavia, questa tecnologia non sempre dà risultati perfetti, e non riesce a dipingere qualsiasi texture, ma nella maggior parte dei casi, le immagini create possiedono un’atmosfera evocativa.

Generare erba o acqua è relativamente facile per le GAN poiché il pattern usato è privo di struttura. Creare invece immagini di edifici e altre strutture, in confronto è molto più difficile, e i risultati sono molto meno realistici. Questo perché tali oggetti hanno una logica e una struttura per la quale l’essere umano è più suscettibile nel coglierne l’attendibilità. Le GAN possono superare questa sfida, ma ci vorrà uno sforzo ulteriore per arrivarci.

Le immagini generate dalla GAN vengono definite multimodali, nel senso che lo stesso schizzo darà sempre risultati differenti ogni volta.

Per allenare questa IA hanno utilizzato 1 milione di foto dal sito Flicker.

Nvidia non ha dichiarato se intende trasformare questo software in un prodotto, ma ha affermato che uno strumento di questo tipo potrebbe in futuro aiutare “tutti dagli architetti e urbanisti fino ai designer e sviluppatori di videogiochi”.

Qui potete provare a disegnare la vostra immagine con l’IA GAN, resa disponibile da Nvidia nel suo Playground.

Abbiamo visto quante cose può fare un’IA; l’arte sarà un altro campo che l’Intelligenza Artificiale esplorerà. Forse non sarà semplice come lo è per gli altri lavori sostituire l’arte, in quanto ha a che fare con la creatività, ma probabilmente avremo un nuovo tipo di arte e di artisti. Non credo che l’arte classica, così come la conosciamo, sarà comunque sostituita poiché non si tratta di un lavoro esclusivamente automatizzabile, e forse la gente ricercherà sempre la creatività fatta dagli essere umani.

Fonte theverge

Dan Brokenhouse

Recent Posts

Il futuro dell’IA e dell’AGI

Un'analisi approfondita dell'imminente arrivo dell'AGI entro il 2027 e del suo profondo impatto sulla tecnologia,…

5 giorni ago

L’IA per combattere la solitudine

Un professore di robotica cognitiva esplora il potenziale delle relazioni con l'IA per sostenere le…

2 settimane ago

L’IA è una “scatola nera”

Anthropic ha trovato un modo per identificare e manipolare le caratteristiche neurali chiave negli LLM,…

3 settimane ago

La terrificante fabbrica di robot in Cina

Video inquietante mostra robot umanoidi iperrealistici in fase di sperimentazione in Cina, sollevando preoccupazioni sul…

4 settimane ago

GPT-4 Omni può esplorare il mondo e interagire in modo più naturale

GPT-4o rivoluziona l'IA con capacità multimodali attraverso testo, audio e immagini, offrendo interazioni simili a…

1 mese ago

L’IA rileva l’empatia cognitiva attraverso clip audio

Uno studio dimostra che l'IA può raggiungere un'empatia cognitiva di livello umano da brevi clip…

1 mese ago