Come i contenuti generati dall’intelligenza artificiale stanno invadendo Internet e minacciando la qualità delle informazioni digitali
Qualità vs. Velocità
Abbiamo ormai imparato ad integrare nelle nostre vite l’intelligenza artificiale, così come da tempo ci siamo abituati ad usare internet per ogni cosa. Se l’IA è diventata una preziosa fonte di informazioni, soprattutto laddove ci è utile per capire meglio un concetto o imparare qualcosa di nuovo, molte persone hanno subito fiutato l’occasione per sfruttare il mezzo, non per farsi aiutare intelligentemente, ossia colmando le proprie lacune o per velocizzare processi ripetitivi, ma proprio per farsi sostituire completamente nel creare contenuti. Di conseguenza, internet si sta popolando man mano di contenuti spazzatura che inquinano il bacino di informazioni esistenti, rendendo sempre più difficile capire quali siano le informazioni e i contenuti realizzati dalle persone, seppur di bassa qualità, rispetto a quelli generati dalle IA.
Questo problema si manifesta in vari ambiti della creazione di contenuti: testuale, fotografico, audio e video.
Testo
Nei contenuti testuali creati esclusivamente basandosi sull’IA è facile che si producano errori concettuali, grammaticali e di traduzione che l’utente ‘speculatore’ solitamente non si cura di correggere, ma tende il più velocemente possibile a trasformare in un prodotto da presentare o vendere.
Immagini
Per quanto riguarda le immagini create dall’IA, esse sono spesso appariscenti e molto ben fatte, ma richiedono un approccio di analisi completamente diverso rispetto alle foto tradizionali. Se prima con Photoshop si partiva da una foto reale correggendo difetti specifici per migliorarla, ora con le immagini generate artificialmente dobbiamo analizzarle completamente per individuare incongruenze e imperfezioni che potrebbero essere nascoste dall’apparente qualità dell’immagine. Tuttavia, spesso le persone si fanno affascinare dalla bella foto, anche se piena di incongruenze ed errori. E chi le pubblica non si cura minimamente di correggerle.
Audio
I contenuti audio artificiali, sebbene più difficili da individuare per via della sempre maggiore naturalezza delle voci e delle sue sfumature, presentano spesso problemi di pronuncia e prosodia oltre ai problemi strutturali legati ai contenuti musicali realizzati in questa maniera. Frequentemente, chi cerca di creare e commercializzare canzoni con l’IA non ha una reale comprensione della struttura musicale e delle regole compositive, producendo così risultati tecnicamente inadeguati.
Video
I contenuti video, tuttavia, rimangono quelli maggiormente complessi da realizzare in maniera artificiale quindi risultano ancora facilmente individuabili e poco sfruttabili, anche se c’è chi cerca di utilizzarli ugualmente.
Etica
Tutto questo è paragonabile a un’industria alimentare che, privilegiando la quantità e la velocità sulla qualità, cerca di vendere a tutti i costi prodotti scadenti mascherandoli con una confezione accattivante. Come nel caso del cibo, anche nei contenuti digitali la qualità viene sacrificata a favore della rapidità di produzione e del profitto immediato.
L’etica è sempre più in secondo piano a favore del profitto. Ciononostante, se da una parte bisogna lottare contro chi consapevolmente sparge informazioni approssimative e forvianti per manipolare il pubblico, dall’altra c’è chi vuole esclusivamente fare soldi cercando scorciatoie che hanno il risultato di produrre contenuti di scarsa qualità se non pieni di errori.
Il problema è che il pubblico accetta anche cose di bassa qualità e piene di difetti. Non ha il senso critico di rifiutare qualcosa perché poco curato. Questo non vuol dire privilegiare l’estetica, ma saper considerare bene l’intento di chi crea qualcosa per uno scopo più profondo rispetto al vendere solamente un prodotto.
Il futuro dell’addestramento dell’IA
Un altro aspetto critico di questa tendenza riguarda l’addestramento delle future IA. Anche senza considerare lo sfruttamento commerciale dei contenuti artificiali, ci troviamo di fronte a una sfida significativa: le future IA verranno inevitabilmente addestrate su contenuti generati dalle IA stesse (il cosiddetto bootstrapping). Questo crea un ciclo potenzialmente problematico, dove ogni generazione di IA potrebbe amplificare gli errori della precedente. Se prima i contenuti esistenti erano in gran parte prodotti da esperti che dedicavano tempo e studio alla loro creazione, ora rischiamo di entrare in una spirale di degrado qualitativo.
A questo si aggiunge il problema delle ‘allucinazioni‘ delle IA, ossia la tendenza a generare informazioni che sembrano plausibili e coerenti ma sono in realtà inesatte o completamente inventate.
Le allucinazioni sono particolarmente insidiose perché l’IA presenta queste informazioni con la stessa sicurezza e lo stesso stile con cui presenta informazioni corrette, rendendo difficile per l’utente distinguere tra fatti reali e contenuti generati erroneamente. Per mitigare questi problemi, sarebbe necessario sviluppare sistemi per tracciare e verificare l’origine dei contenuti, creando dataset separati che distinguano chiaramente tra contenuti umani verificati e contenuti generati dall’IA. Questo permetterebbe di mantenere una base di dati ‘pulita’ per l’addestramento delle future IA, evitando il rischio di amplificare errori e imprecisioni attraverso generazioni successive di modelli.
Un nuovo approccio

La sfida che le IA hanno lanciato a Google ha creato un ulteriore problema: il cambiamento del processo di ricerca. Se prima cercavamo su Google qualsiasi cosa ed esso ci restituiva una serie di pagine tra cui scegliere, utilizzando la ricerca con l’IA non siamo più noi a scegliere le fonti, ma ci vengono automaticamente date risposte pertinenti alle nostre domande. Questo cambiamento, sebbene possa portare a risultati più mirati, rischia di ridurre la pluralità dei contenuti e potrebbe facilitare forme di censura indiretta.
Inoltre, questo nuovo paradigma solleva questioni importanti sulla sostenibilità della creazione di contenuti. Ci eravamo abituati a un sistema in cui i creatori venivano principalmente retribuiti attraverso la pubblicità di Google, che li stimolava a produrre contenuti di qualità. Ma se i contenuti vengono direttamente estrapolati da un’IA, chi visiterà i siti web dei creatori? Come si manterrà economicamente sostenibile la produzione di contenuti originali? Che ne sarà della ricerca più approfondita, dei forum di discussione specializzati, delle comunità di nicchia, della ricerca di file nella rete? La perdita di possibilità rappresenterebbe un impoverimento significativo dell’ecosistema digitale.

