Considera l’ornitorinco

di Alberto Puliafito

Un animale che ha sfidato la tassonomia naturalistica umana mette a dura prova – per ora – anche le intelligenze artificiali generative

Vari tentativi non riusciti di far disegnare a Midjourney il ritratto di un ornitorinco: gli animali che vengono fuori sembrano delle foche o qualcosa del genere, oppure in tutto e per tutto degli uccelli

Giocare con le intelligenze artificiali generative (come ChatGPT o Midjourney) è fondamentale per padroneggiarle, ma anche per scoprirne i limiti.

Per esempio, giocando con Midjourney mi sono reso conto che ha enormi difficoltà a realizzare un’immagine credibile, realistica e accurata di un ornitorinco.

Leggi "Kant e l'ornitorinco" di Umberto Eco

La questione, che può sembrare buffa o insignificante, ha invece una serie di risvolti interessanti.
Primo: il problema non è solo mio, ma generalizzato. Su Reddit c’è chi racconta la medesima scoperta, così come nel gruppo ufficiale di Midjourney su Facebook, in questa conversazione.

Sperimentando con altre macchine analoghe a giugno 2023, il risultato non cambia. L’ornitorinco sfugge alla capacità creativa di un’intelligenza artificiale, in questo momento.

Perché accade?

La risposta più semplice e più ingegneristica è: non ci sono abbastanza immagini di ornitorinchi nel set di dati con cui questi strumenti sono stati addestrati.

È una risposta credibile, e forse suggerisce due cose:

le macchine non hanno ancora la capacità umana di “vedere” una sola immagine di un animale e immaginarne/generarne molteplici mantenendo tutte le caratteristiche di quell’animale
probabilmente, con “forza bruta” (inserendo cioè migliaia di immagini di ornitorinchi) si otterrà un risultato sempre più accettabile

Ma c’è anche un’altra risposta, più complessa. In effetti, l’ornitorinco ha già messo in crisi l’intero sistema tassonomico animale ben prima che arrivassero le intelligenze artificiali: un mammifero che depone le uova non dovrebbe nemmeno esistere.
Eppure esiste.

Per anni si è dibattuto se le sue uova esistessero o meno, se la femmina ornitorinco avesse o meno le mammelle.
L’ornitorinco, d’altra parte, è un mammifero insolito che possiede caratteristiche di diversi animali, come un becco simile a quello di un’anatra e una coda come quella di un castoro.

Nel suo libro “Kant e l’ornitorinco”, Eco utilizza questo insolito animale come simbolo delle sfide che la realtà presenta alle nostre categorie di pensiero.
Kant, con la sua teoria della conoscenza, aveva sostenuto che le nostre percezioni della realtà sono in parte determinate dalle categorie innate della mente.

Eco esplora come la realtà – qui rappresentata dall’ornitorinco – spesso non si adatti alle categorie che abbiamo predisposto per comprenderla. In altre parole, la realtà può essere più complessa e sfuggente delle nostre strutture mentali e dei nostri sistemi di classificazione.

D’altra parte, non hai un’idea innata di ornitorinco finché non lo vedi. E quando lo vedi, la prima volta, non ci credi.

Non è mica colpa dell’ornitorinco. Non è un limite – e dunque non è colpa – della realtà. È un limite dei nostri sistemi di classificazione.

Realtà e capacità descrittiva della realtà vanno di pari passo, esattamente come per un’intelligenza artificiale generativa è fondamentale sia il contenuto di un’immagine sia l’etichetta di quell’immagine.

L’ornitorinco, per il momento, è non-etichettabile.

Ho provato, allora, a farmi scrivere da ChatGPT una descrizione articolata di “ornitorinco”. È venuto fuori un lungo prompt che ho proposto a Midjourney.

Il risultato è decisamente più vicino dei precedenti a un ornitorinco, ma non è affatto un ornitorinco. Le quattro opzioni che mi ha offerto Midjourney sono altri animali, che non esistono e che sono anche perfettamente credibili e verosimili.

Questa è la versione del prompt in inglese: «Generate an image of an adult platypus (Ornithorhynchus anatinus) in its natural habitat. The creature is positioned half in, half out of a clear, gurgling stream, surrounded by lush Australian bush vegetation. The sunlight filters through the overhead foliage, casting dappled shadows on its wet, dark – brown, waterproof fur. The platypus is mid – motion, with droplets of water falling from its body as it emerges from the stream. The streamlined body is about 50 centimeters long, somewhat resembling a compact, chunky otter. It has a distinct, flat tail, similar to that of a beaver, serving as a fat reservoir, that appears sleek and is partly submerged in the clear water. The creature’s most striking feature, the duck – billed snout, is clearly visible. It’s a flexible, rubbery, and sensitive organ, a shade darker than the body, which it uses to detect its prey underwater. Its eyes are small, round, and alert, with a spark of inquisitive intelligence. They are closed, protecting it from the water. No external ears are visible, hidden behind the fur, but the platypus is still capable of sensing sounds around it. Webbed, clawed feet paddle at the water’s surface, showing off their full expansion. When on land, the webbing retracts, exposing more of the claws which help in digging burrows. Lastly, just visible beneath the water surface, is the male platypus’s infamous spur on the hind limb, a sharp point that can deliver a venomous sting, a rare trait among mammals. This image encapsulates the unique features and mysterious charm of the platypus, truly one of nature’s most interesting creations».

L'ornitorinco secondo Midjourney. Il prompt originale per farlo creare era: «Generate an image of an adult platypus( Ornithorhynchus anatinus) in its natural habitat. The creature is positioned half in, half out of a clear, gurgling stream, surrounded by lush Australian bush vegetation. The sunlight filters through the overhead foliage, casting dappled shadows on its wet, dark - brown, waterproof fur. The platypus is mid - motion, with droplets of water falling from its body as it emerges from the stream. The streamlined body is about 50 centimeters long, somewhat resembling a compact, chunky otter. It has a distinct, flat tail, similar to that of a beaver, serving as a fat reservoir, that appears sleek and is partly submerged in the clear water. The creature's most striking feature, the duck - billed snout, is clearly visible. It's a flexible, rubbery, and sensitive organ, a shade darker than the body, which it uses to detect its prey underwater. Its eyes are small, round, and alert, with a spark of inquisitive intelligence. They are closed, protecting it from the water. No external ears are visible, hidden behind the fur, but the platypus is still capable of sensing sounds around it. Webbed, clawed feet paddle at the water's surface, showing off their full expansion. When on land, the webbing retracts, exposing more of the claws which help in digging burrows. Lastly, just visible beneath the water surface, is the male platypus's infamous spur on the hind limb, a sharp point that can deliver a venomous sting, a rare trait among mammals. This image encapsulates the unique features and mysterious charm of the platypus, truly one of nature's most interesting creations».

Questo limite che sembra della macchina, in realtà, è un limite molto umano: è il limite del modo in cui conosciamo e etichettiamo animali, oggetti, elementi della realtà che ci circonda. E la macchina, che è progettata dall’uomo ha – almeno per ora – un limite molto simile.