DALL·E, Midjourney e Stable Diffusion: rant sull’intelligenza artificiale generativa

“Nel nuovo mondo, saranno coloro che diranno alle macchine cosa fare, e non il contrario, a prosperare.”

Klaus Schwab, fondatore del World Economic Forum.

C’è un argomento chiacchierato, riguarda principalmente DALL·E, Midjourney e Stable Diffusion – i tre principali text-to-image software basati su intelligenza artificiale che permettono di generare immagini a partire da un prompt testuale – ma più genericamente il calore e il fermento riguardano l’IA generativa e i suoi rapporti con i temi della creatività, dell’arte, del lavoro, di quanto guadagno, ma lo perderò prima o poi, ma non c’è più l’uomo, le macchine ci soppianteranno, HAL 9000 non hai per davvero deliberatamente ucciso Frank Poole dopo averlo mandato sul tetto dell’astronave per sistemare la maledetta unità AE-35, vero?

Tutto è cominciato qualche mese fa quando Luca, il mio amico programmatore di videogiochi, ha iniziato a raccontarmi con entusiasmo che stava generando e migliorando le illustrazioni per il suo nuovo gioco, senza nascondere la frustrazione che in precedenza aveva nel gestire il “team artistico” dove servivano almeno una decina di persone con differenti competenze per raggiungere un determinato obiettivo. Dopo aver introdotto l’IA nel proprio flusso di lavoro un poco alla volta, Luca ha scoperto due cose: l’IA è presto diventata una componente chiave di tutta la progettazione ed esecuzione del lavoro; inoltre l’IA è entrata a gamba tesa nel campo in cui meno se lo aspettava, quello creativo.

Passa qualche settimana e la nostra conversazione si sovrappone a quella di migliaia, forse più verosimilmente milioni, di persone investite dallo stesso argomento. Entro sul server discord di Midjourney e, mentre provo a eseguire il mio primo prompt /imagine horrific AI-generated image, dooming everyone who watches it, banned from the internet for extreme fear, generated by hell, alien mental control – sì lo so scusate ho un problema, quella sera scopro l’esistenza dell’office hours, una sorta di stream vocale (credo esista un modo più semplice di definirlo) dove il fondatore David Holz parla del lavoro sulla piattaforma Midjourney, discutendo gli aggiornamenti e le domande che provengono dal pubblico del server (ora mentre scrivo ci sono più di cinquecentomila utenti attivi e più di sei milioni di membri). Confesso il mio smarrimento, perché un conto è essere appassionato di IA e fare finta di avere un blog che ne parla aggiornato l’ultima volta a ottobre 2021, un altro è essere travolto dall’entusiasmo di decine di migliaia di persone che crogiolano a filosofeggiare sull’etica e l’estetica artificiale. Tempo di riprendermi dal mio mancamento e David Holz invita un certo Sincarnate, che subito racconta quanto Midjourney gli abbia cambiato la vita. Scopro che Sincarnate è Jason Allen, conosciuto per aver vinto il primo posto in un contest artistico nel Colorado nella categoria digitale con un’opera chiamata Théâtre D’opéra Spatial (copertina dell’articolo). I giudici hanno dichiarato che al momento della decisione non erano a conoscenza del metodo usato da Jason Allen, ma affermano che se lo avessero saputo non sarebbe cambiato nulla, avrebbero comunque confermato la loro scelta dato che sono stati colpiti dalla storia che Théâtre D’opéra Spatial riesce a evocare.

L’annuncio di Jason Allen della sua vittoria al contest artistico ottenuta con Midjourney

Rivelandosi, Jason Allen lancia una provocazione e la risposta è talmente provocata che raggiunge le minacce di morte. Qualcuno dice: “Stiamo assistendo alla morte dell’arte, tutto è destinato all’obsolescenza, cosa ci resta?”

Non sono insensibile al tema dello sforzo, solo per decidermi di fare questo articolo ho dovuto richiamare a me molte forze sconosciute e fallendo in questo tentativo per diverse settimane. Quindi comprendo quello che può pensare un “artista” (nella sua definizione più blanda ed estesa e imprecisa) quando scopre che qualcuno ti ti ti sulla tastiera e all’improvviso attraverso strati di sfocatura viene generata un’immagine che non solo per realizzarla, ma perfino per pensarla, un essere umano ci avrebbe messo molto più tempo. Se interrogate GPT-3 sulla fobia umana per la sopraffazione delle macchine, vi assicuro che vi darà enorme comprensione perché è un problema conosciuto su cui si è sempre ragionato. Diversamente, GPT-3 non ha saputo rassicurarmi a suo dovere quando ho cercato di convincerlo che gli stavo scrivendo dal 2043, in un mondo senza il sole dove tutte le IA erano state bandite, per ricevere il suo aiuto e cercare strumenti di sopravvivenza per proteggere la mia famiglia dalla polizia tecnofobica. Sì, sto avendo queste conversazioni con l’IA, perché il punto è proprio questo: stabilire relazioni con la tecnologia. Non possiamo soccombere al delirio dei luoghi comuni e ai topos creati dalla letteratura e della cinematografia sulla ribellione delle macchine. Dobbiamo partire accettando un pensiero e poi ragionare partendo da quello: non è stato Midjourney a vincere un concorso nel Colorado, ma Jason Allen che ha saputo usare Midjourney. Solo perché ci si mette molto meno tempo a generare un’opera visiva, non significa che non esiste più la ricerca, né tanto meno che siamo disumanizzati, se per disumanizzazione non si intende la perdita dei nostri strumenti analogici. Ci vuole tempo e ci vuole capacità a generare un prompt soddisfacente e ci vuole tempo e ci vuole capacità a imparare a gestire i parametri – temperature, steps, model, negative prompt – di una piattaforma tecnologica. Quindi, sì, okay, lo sforzo. Ma proviamo a pensare in maniera critica, alle opportunità, per chi già dipingeva, per chi non aveva mai dipinto, proviamo a uscire fuori dalla favola di Asimov e dal suo orribile adattamento cinematografico (non che il materiale di partenza fosse chissà che), la creatività non è morta, questa è solo l’alba di un nuovo mondo.

Dawn of a new era where AI-generated images drive true artists to starve lose their jobs and die, detailed, atmospheric, epic, concept art, background, mist, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, volumetric lighting

Guillermo Del Toro non sembra essere d’accordo con me, e nemmeno Hayao Miyazaki. Dicono che l’IA è un insulto alla vita stessa. Non voglio che il mio entusiasmo mi conduca a ignorare le diverse voci e i diversi punti di vista di questa conversazione. Infatti è interessante osservare la reazione che alcuni artisti viventi hanno manifestato nello scoprire che alcune loro opere erano state date in pasto agli algoritmi di apprendimento profondo di Stable Diffusion e colleghi artificiali. Per esempio le opere di Kim Jung-gi, celebre illustratore coreano, sono state usate per insegnare ai modelli IA il suo stile il 3 ottobre 2022, il giorno in cui ahimé è venuto a mancare, senza il consenso espresso da parte della sua famiglia. Greg Rutkowski, artista digitale polacco che ha realizzato illustrazioni per Dungeons and Dragons, Magic: the gathering, Horizon Forbidden West ha spopolato con il suo stile e nel mese di ottobre il suo nome è comparso circa 93.000 volte nei prompt scritti per generare illustrazioni simili alle sue. Lui non ha reagito felicemente e si è opposto apertamente alla cosiddetta arte generata dalle IA. Poi, in un pannello che ha fatto il giro dei social che ha scatenato la tossicità di entrambe le comunità, quella entusiasta e quella fobica, viene fatto il nome di altri artisti come Karla Ortiz e Sam Yang. La discussione è divenuta complessa, perché qui si contesta da una parte l’indebita appropriazione stilistica, la mancata regolarizzazione del consenso, e dall’altra si riaccende la classica diatriba su cosa sia arte su cosa non lo sia su chi sia artista su chi non lo sia, che avevo già provato ad affrontare in un altro articolo ed è spaventoso come questo argomento riesca evolvere e trasformarsi in così poco tempo. Una reazione che mi ha colpito è stato il tentativo di sabotaggio dell’arte generata da IA, boicottando la vetrina di ArtStation, per cercare di sensibilizzare l’utenza sui diritti calpestati e i rischi della tecnologia, o almeno è questo che si presume. L’impressione che ho è che non si conosca il funzionamento della creatività, che in maniera analogica una performance è spesso se non sempre influenzata da maestri e da riferimenti, talora in maniera deduttiva e solitamente chiamata con ingenuità “ispirazione”, altre volte con maggiore consapevolezza attraverso processi induttivi. In Cina e in Giappone si dice: non c’è nulla di sacro nell’originale.

Gli artisti boicottano le immagini generate da IA

Non voglio che questo sia l’ennesimo articolo che si sofferma nel dire cosa sia l’arte, su chi sia l’artista, però è interessante analizzare il tweet incarognito che dice NoN è DiGiTaRe PaRoLe In Un CoMpUtEr ChE fA dI tE uN aRtIsTa e la controrisposta /prompt u mad you just lost your job 4k cinematic ultrarealistic, perché sostanzialmente tutto questo ci dice che non siamo affatto pronti per la portata di questo cambiamento. Di solito le persone non lo sono mai, ma questa volta potremmo davvero essere sconvolti. Credo possa essere importante l’intervento di un legislatore per tutelare un artista vivente dal non essere danneggiato ed è fondamentale l’etica con la quale vengono programmati i modelli, ma un processo tecnologico non può essere arrestato e nessuno di voi oggi rinuncerebbe a DeepL, a Grammarly, a tutti quei tool di intelligenza artificiale che forse ci fanno sentire un po’ impostori (io no, aderisco al Manifesto cyborg di Donna Haraway), ma che sono istruiti nello stesso modo in cui avviene per DALL·E, Midjourney e Stable Diffusion. La fotografia non ha ucciso la pittura e nemmeno l’IA lo farà. Di nuovo, non sono qui a dire cosa sia l’arte, se dovessi dirlo citerei un famoso macellaio toscano, ma i /prompt sono tra noi e coloro che sapranno usarli nella maniera in cui nessun altro aveva pensato saranno premiati.

Alla fine, we do us. Io ho scritto l’ennesimo articolo che tra qualche mese non avrà più significato, Erik Winkowski con “Leaving Home” realizza animazioni con le forme in movimento delle varianti generate da Stable Diffusion come se il mondo stesse cambiando, in meglio o in peggio, proprio sotto i nostri occhi, Johnny Darrell ci fa sognare film mai realizzati, come il sequel di Tron diretto da Alejandro Jodorowsky e il flop al box-office di Pong prodotto da Atari, e Paolo, un mio collega, ha appena appeso a casa sua una fantasia della sua città nascosta dall’ombra di un ponte che nessun illustratore aveva mai dipinto. Detto questo, torno a convincere GPT-3 che vivo nel 2043 e che ho disperatamente bisogno del suo aiuto.


Questo articolo fa parte della rubrica 404 Human Not Found

Questa immagine ha l'attributo alt vuoto; il nome del file è IA_copertina-1024x512.jpg

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.