Un viaggio a 8 bit con il Rabbit r1
Da Sanremo a Magenta, fotografando con un aggeggio strano che converte, inventando, le tue foto rendendole digital-retrò.
Il filosofo e artista digitale Francesco D’Isa presenta la graphic novel Sunyata, un viaggio onirico alla ricerca di sé illustrato con le intelligenze artificiali.
Il testo che stai per leggere è la prefazione di un libro che ha suscitato polemiche, tantissime, alcune comprensibili, molte altre meno, alcune pacate, molte altre violente, cattive, arrivando perfino all’assurdità delle minacce di violenza fisica lanciate sui social all’autore, Francesco D’Isa.
Non pubblichiamo questo testo per riaccendere quelle polemiche, ma perché, nella sua brevità, lucidità e precisione, rappresenta la migliore spiegazione di qualcosa che, se si segue il dibattito sul tema, spesso si perde: le AI non sono affatto discontinue rispetto al mondo in cui viviamo. Il problema che ci pongono di fronte non è affatto nuovo e c’centra con il possesso, lo sfruttamento, la concentrazione del potere.
Buona lettura.
L’agosto del 2022 è stato un mese strano. Ero in vacanza con la mia compagna, poco tempo prima mia madre aveva concluso una chemioterapia che per poco non l’ha uccisa, nella speranza che ne sia valsa la pena. Mio padre era stanco, lo ero anche io, lui aveva anche qualche dolorino. Nel frattempo ero entrato da poco nel gruppo di beta tester di vari software TTI (text-to-image), queste “intelligenze artificiali” che intelligenti non sono, o per lo meno non più di altri strumenti che già ci superano in determinate funzioni (come una calcolatrice con le operazioni matematiche). Né così artificiali, perché si nutrono di dati umani, secondo indicazioni umane, selezioni umane e algoritmi predisposti da umani, per poi rispondere a istruzioni umane, grazie alle quali esplorano e plasmano spazi semantici umani.
La mia formazione professionale a metà tra arte digitale e filosofia mi aveva già spinto a esplorare le prime versioni di queste tecnologie – non da programmatore, perché non è il mio campo, ma da artista e filosofo, incuriosito da quel che rifletteva questo specchio tecnologico. Nuove teorie della mente, la trasformazione del linguaggio visivo da analogico a digitale[1], la possibilità di praticare immaginazione attiva su schermo, l’esplorazione di spazi semantici attraverso attrattori (parole) che operano iconogenesi… insomma, ci ero andato in fissa, e da allora non ho smesso di esplorare un mezzo che può fare quello che sognavo da anni: trasformare le parole in immagini.
Sebbene a tutta prima queste tecnologie siano semplicissime da usare, arrivare dove volevo non lo era. Sono strumenti probabilistici figli del campo iconografico preesistente e tendono a plasmare immagini secondo i canoni più frequenti tra noi umani, dunque derivative, patinate, commerciali, kitsch. Considerata l’ampiezza della nostra produzione visiva nei secoli e le infinite possibilità di ibridazione che consente il mezzo però, lo spazio latente delle possibilità artificiali, seppur limitato, è comunque immenso, ricco di luoghi di grande interesse.
Poi sono arrivate le polemiche. Se pensi che le Ai rubano agli artisti, che non fanno nulla di buono e sono uno strumento del capitalismo per stritolare le nostre vite stai per avere una delusione. Non ti offrirò argomenti che tu possa smontare con un bel commento su qualche social, perché ho già scritto moltissimi articoli in merito e se ti interessa la mia opinione sui temi di cui sopra ti invito a leggere questi testi disponibili online[2]. Potrai comunque pensare che sbaglio, ma ammetterai che mi sono preso il tempo per rifletterci. Mi limiterò qui ad accennare che queste tecnologie creative – come molte altre di uso comune, dagli inchiostri ai computer, passando per le macchine fotografiche e i software di computer graphics – presentano senza dubbio varie criticità, ma che queste più che testimoniare un cambio di paradigma rispetto al passato vi si inseriscono senza troppi salti.
Le immagini di questa storia illustrata sono state create prevalentemente con Midjourney, nell’ormai “vecchissima” versione 3 (o Test). Per i sogni ho usato la 4 e per le scene nel bagno Stable Diffusion XL. Quando ho iniziato a lavorare a Sunyata, la versione 3 di Midjourney era la più recente, mentre adesso sembra quasi vintage. Ciononostante ho deciso di mantenere queste immagini, perché quel che cercavo non era una dimostrazione muscolare della tecnica, che peraltro è in continua mutazione, ma solo le immagini adatte allo scopo. Il testo invece è stato creato senza l’ausilio di intelligenze artificiali. La ricerca dei vari prompt ha richiesto lavoro e ricerca, perché come dicevo la maggior parte delle immagini facili da ottenere con queste piattaforme ruotano attorno a estetiche che non mi interessano, ed è necessaria la giusta alchimia per esplorare le zone più perturbanti dello spazio latente.
Questo lavoro sarebbe stato più semplice se fossi in possesso di TTI personali, con un dataset selezionato ed etichettato da me, ma purtroppo non è stato possibile per motivi economici. Al momento infatti queste tecnologie, così come i computer e le macchine fotografiche, sono impossibili da produrre se non su scala industriale, perché per nascere richiedono la raccolta di miliardi di immagini, la loro curatela, un grande lavoro di programmazione e moltissima potenza di calcolo. Anche per una grande azienda costruirle richiede un investimento oneroso. Se in futuro in alcuni paesi l’uso dei dati per addestrarle non dovesse essere considerato “fair use”, alle aziende locali si aggiungerà lo sforzo economico di acquistare i diritti di milioni di immagini, a meno che non li possiedano già[3]. In ogni caso al momento si tratta di un impegno finanziario impossibile per i singoli e infatti chi costruisce tecnologie TTI personalizzate o si appoggia su motori open source preesistenti (come Stable Diffusion, Llama, ecc) o si limita a strumenti dalla potenza estremamente limitata, vincolati solo a un unico soggetto[4] o funzione.
Sul tema dataset, fair use e copyright ho scritto altrove[5], ma per farla breve mi schiero dalla parte di chi è critico verso l’attuale normativa (e a maggior ragione un eventuale inasprimento) sui diritti d’autore e pensa che queste norme avvantaggino le grandi aziende e non gli artisti, se non i più famosi. Da un punto di vista filosofico invece sono convinto che ogni opera d’arte sia un processo collettivo e che l’idea di genio sia la stantia proiezione machista di una società individualista[6]. Per questo motivo e per dimostrare che si può stare sul mercato anche senza copyright, assieme alla casa editrice Eris abbiamo deciso di rilasciare quest’opera di pubblico dominio. Ho deciso comunque di non pubblicare i prompt utilizzati, e così farò finché non sarà opinione corrente che le TTI sono uno strumento con pari dignità creativa di altre tecniche artistiche.
I prompt sono essenzialmente delle brutte frasette e non voglio dare spago a eventuali critici che inevitabilmente direbbero che “è troppo facile”: è semplice anche scrivere M’illumino di immenso, ma non tutti come Ungaretti siamo in grado di concepire questa poesia – insomma, come diceva Munari in Verbale scritto, “quando qualcuno dice: questo lo so fare anch’io, vuol dire che lo sa rifare, altrimenti lo avrebbe già fatto prima”. Non ho usato nessun artista vivente nei miei prompt, anche se la reputo un’accortezza del tutto inutile dal punto di vista tecnico[7] e lo faccio più che altro per evitare altre polemiche pretestuose. Scrivo senza filtri, così come ho composto questa storia, e posso permettermi di esprimermi senza troppi giri di parole o argomenti a sostegno.
Alla radice dei peggiori danni sociali che possono causare queste tecnologie c’è un rischio di cui pochi si lamentano: creare una tecnologia che pochissimi possiedono e alcuni privilegiati[8] utilizzano. Credo che la reazione di alcuni lavoratori e lavoratrici nel campo dell’arte visiva sia deragliata per via di un’improvvisa paura – comprensibile e in parte fondata, ma non causata, quanto rivelata dalle AI. La filiera creativa vive da ben prima di questa innovazione di commissioni sottopagate, sfruttamento, ambienti tossici, contratti capestro, prodotti scadenti e frustranti da realizzare. Adesso per creare queste immagini e testi mediocri di cui noi creativi abbiamo letteralmente inondato il mondo non serve più una competenza tecnica, perché sono le uniche davvero facili da ottenere con le AI, anche se non le sai usare bene. Di conseguenza abbiamo paura di perdere le briciole che ci erano rimaste, tanto da voler bloccare almeno le macchine, che sembrano più fragili di chi le comanda – di chi ci comanda e ci comandava anche prima. Ma le macchine non si romperanno e la nostra scelta è se lasciarle in mano a chi ci aveva usato come tali o se provare a intaccarne il monopolio e pretendere che siano pubbliche e aperte.
Per tornare al libro, il titolo rimanda a Śūnyatā, un termine sanscrito che si traduce spesso come “vuoto” o “vacuità”, ma la cui essenza va ben oltre la nozione di assenza.
È un concetto strettamente legato alla trascendenza delle dualità che nella filosofia di Nagarjuna dà luogo a illuminanti paradossi[9]. L’idea di Śūnyatā non è solo una riflessione filosofica, ma una rivelazione che secondo la tradizione buddhista può portare alla liberazione dalla sofferenza e all’illuminazione. Sebbene non fosse mia intenzione lavorare sulla Śūnyatā quando ho iniziato a creare questo libro, dopo averlo concluso mi è sembrato che il tema fosse quello – e d’altra parte la migliore intenzione per parlare di Śūnyatā è proprio non averne alcuna.
I primi giorni di settembre 2022 la bozza di questo lavoro era conclusa e i dolorini di mio padre si sono dimostrati segnali di una malattia che lo ha ucciso in meno di due mesi. Nel rileggere Sunyata oggi mi sembra evidente che stavo elaborando un lutto che doveva ancora arrivare. Purtroppo lui non potrà leggerlo, ma non importa, perché al momento conosce la Śūnyatā meglio di noi.
[1] Secondo la definizione del Filosofo Nelson Goodman, in Nelson Goodman, tr. Brioschi F., I Linguaggi Dell’arte, Il saggiatore, Milano, 2017.
La rivoluzione degli algoritmi nel mondo dell’arte, Il Tascabile
What is like to be a bot, The Italian Review
Non fa tutto il computer, L’Indiscreto
Diritti digitali, DZine
Oltre il copyright, Che fare
Le Ai verso il monopolio, Chefare
La verità nell’era della riproducibilità digitale, 2001
L’intelligenza artificiale generativa distoglie l’attenzione dal vero pericolo incombente, Siamonine
[3] Attualmente ad esempio Getty Images ne ha 350 milioni, Adobe stock 200 milioni, shutterstock 406 milioni.
[4] Si veda ad esempio Myriad, di Anna Ridler, che ha fatto decine di migliaia di foto a tulipani in una residenza in Olanda per creare una TTI che genera (solo) tulipani. Purtroppo questo metodo di lavoro con le GAN è per pochi, non tutti possono permettersi di passare mesi a fare foto a tulipani (o altro). Oppure dall’altro lato si pensi al lavoro di Roberto Fassone, And We Thought che a partire dal GPT2 open source di OpenAI ha addestrato un sistema linguistico su resoconti psichedelici.
[5] Plagio o ispirazione? su The Italian Review
[6] Picasso avrebbe sviluppato il cubismo se fosse nato nel 1300, senza tutto il lavoro tecnologico e culturale fatto da altri nei secoli successivi? Ovviamente no.
[7] Con una TTI posso tranquillamente imitare un artista senza fare il suo nome nel prompt, così come usare il suo nome per ottenere immagini che non hanno nulla in comune con il suo lavoro. Conta il risultato, non il processo.
[8] Si può trattare anche di milioni di persone, che però nell’ottica globale restano pochi privilegiati. La lotta per un dataset proprietario va esattamente in questa direzione.
[9] cfr Emanuela Magno, Nāgārjuna: Logica Dialettica e Soteriologia, Mimesis, Milano, 2012.
Da Sanremo a Magenta, fotografando con un aggeggio strano che converte, inventando, le tue foto rendendole digital-retrò.
Michela Murgia ha smosso le coscienze italiane ricordando a tante donne che possono non stare zitte.