

À la biennale de Venise, en 2022, on pouvait voir une œuvre intitulée "Missing Person Cyborg 2021" de Lynn Hershman Leeson, créée de toute pièce par intelligence artificielle. Bruno Nassim Aboudrar, Professeur d'Histoire et théorie de l'art, reçoit deux spécialistes de l'intelligence artificielle.
- Matthieu Cord Professeur à Sorbonne Université, chercheur en vision artificielle, intelligence artificielle et deep learning
- Antonio Somaini Professeur à l'Université Sorbonne Nouvelle, chercheur en esthétique, théorie et histoire des images, des médias et de la culture visuelle
La création d’images, et la faculté extraordinaire qu’a le dessin d’imiter les objets du monde, aussi bien que les formes qui se présentent à l’imagination, était tenue jusqu’à récemment pour une caractéristique exclusive de l’être humain, et l’une des plus prestigieuses. C’est parce qu’ils en sont doués à un haut degré que les artistes - et plus généralement les faiseurs d’images - jouissent d’une aura particulière dans de nombreuses sociétés, dont les nôtres. Réciproquement, l’identification des images est un propre de l’humain, et toutes sortes de bénéfices sociaux s’attachent à celles et à ceux qui l’ont particulièrement développé : connaisseurs, experts, gens de goût. Or, désormais, l’intelligence artificielle, et le deep learning, sont sur le point de destituer l’être humain de ce double privilège. Non seulement les machines apprennent à reconnaître des images de plus en plus complexes, mais elles savent désormais en créer, presque sans programme, presque librement, comme font les artistes.
Antonio Somaini "Le terme [d'intelligence artificielle] apparaît pour la première fois en 1955 dans une demande de financement pour un workshop qui aura lieu l'année suivante et qui s'est transformé au fil des années en suivant l'évolution des technologies informatiques et de leurs liens avec des disciplines comme la psychologie cognitive ou encore les neurosciences. Le concept d'intelligence artificielle renvoie à toute une série de technologies et d'applications fondées sur ce que l'on appelle le "deep learning" ou l'apprentissage profond, c'est-à-dire un ensemble de méthodes d'apprentissage automatique fondées sur des algorithmes qui sont structurés comme des réseaux de neurones artificiels et qui sont capables d'apprendre de manière plus ou moins autonome à traiter des vastes quantités de données pour produire des formes d'analyse, de prédiction ou déclencher tout type d'opérations."
Matthieu Cord "Ces machines ne sont pas du tout autonomes. [...] Les machines dont on parle sont des algorithmes qui sont entraînés dans des cadres qui sont assez clairement définis par des humains, pour des objectifs et des fonctions qui sont définis par les humains."
Les machines ont également emprunté aux historiens de l’art ou aux critiques une compétence descriptive : les machines disent désormais ce qu’elles voient. Ces progrès rapides des technologies informatiques posent des questions vertigineuses à l’avenir immédiat, qui portent aussi bien en esthétique (qu’est-ce qu’une liberté créatrice programmée ? A qui incombera le jugement de goût ? Comment de telles images se situent-elles par rapport aux deux stocks existants que sont l’imaginaire et l’iconographie ?), qu’en épistémologie (sur le rôle et la fonction des technologies imageantes, qui n’ont pas attendu l’informatique pour s’imposer) et en éthique.
Pour en parler, Bruno Nassim Aboudrar, Professeur d'Histoire et théorie de l'art, producteur de cette série sur l'art et le méconnu, reçoit Matthieu Cord, Professeur à Sorbonne Université, chercheur en vision artificielle, intelligence artificielle et deep learning, qui travaille plus particulièrement sur la vision par ordinateur, et Antonio Somaini, Professeur à l'Université Sorbonne Nouvelle, chercheur en esthétique, théorie et histoire des images, des médias et de la culture visuelle. La traduction de l’ouvrage Culture Visuelle, coécrit avec Andrea Pinotti, vient de paraître aux éditions des Presses du Réel. Il s’agit d’une traduction enrichie par rapport à l’ouvrage en italien, et notamment d’un chapitre intitulé L’Impact de l’intelligence artificielle sur la culture visuelle contemporaine.
Antonio Somaini "Il y a des avancées très importantes dans les années 1980 et, autour de 2010, il y a une explosion qui est fondée sur la possibilité de créer non seulement des réseaux de neurones artificiels avec beaucoup de couches, mais aussi d'utiliser de vastes bases de données d'images comme des "training set", c'est-à-dire des ensembles d'entraînement. Et cela permet d'appliquer cette technologie de "Machine Vision" à des quantités énormes d'images accessibles en ligne."
Matthieu Cord "La première phase de déploiement de ces algorithmes est cette fameuse phase d'entraînement où on donne à la machine une entrée, c'est-à-dire une image. Donc, elle va traduire et faire une sortie qui est quasiment aléatoire. [Par exemple] c'est un chat et là, on va lui dire, parce que nous, on sait, que c'est un chien. [...] On va essayer d'ajuster les paramètres de la machine pour que la prochaine fois qu'on lui présente éventuellement cette même image, elle ne se trompera pas. Et donc toute cette science du réglage de ses paramètres a pris 20 ou 30 ans avant de prendre son essor en 2010 avec de très grosses bases de données."
Antonio Somaini "L'histoire des images nous a fait connaître plein d'images cachées qui ne sont pas accessibles, mais aussi des images latentes, comme celles des pellicules photographiques avant leur développement, les faisant alors devenir manifestes. Or c'est un nouveau phénomène que des images soient visibles par des machines sans être visibles par des yeux humains. Cela constitue un vrai moment de rupture dans l'histoire des images."
Matthieu Cord "Qu'est-ce que le traitement d'une image ? C'est un signal bidimensionnel qui est effectivement visible par les humains si jamais il correspond à une projection dans le domaine du visible pour nous, c'est-à-dire à des pixels en couleur ou en noir et blanc. Mais dans ces cas-là, et seulement dans cette frange-là de signaux, on va pouvoir les voir."
Antonio Somaini "Nous assistons, à travers la culture visuelle contemporaine, à deux tendances présentes en même temps et qui peuvent paraître contradictoires. D'un côté, il y a une poussée très forte vers des degrés de résolution toujours plus grands : cela se manifeste avec nos écrans de télévision, de smartphones, d'ordinateur ; mais aussi dans la qualité des fichiers d'images et dans le champ de l'intelligence artificielle en général. Or, d'un autre côté, il y a une sorte de survivance de la basse définition, de l'image pixelisée, de l'image avec du grain. [...] Et ce qui est très intéressant est le fait que des artistes qui ont commencé depuis une dizaine d'années à utiliser des technologies d'intelligence artificielle générative vont souvent aussi chercher des moments de mal fonctionnement, d'hybridation et de glitch."
Matthieu Cord "Je pense qu'effectivement, pour l'artiste, on a à disposition un outil génial qui est beaucoup interrogé par le biais du "bug". L'artiste cherche la limite de cet objet technique qu'il a entre les mains et va donc plutôt voir quand l'image produite va être bizarre. Et il y a aussi tout ce pan qui je pense est encore à découvrir, et qui est autour de la stylisation. D'une certaine façon, c'est comme s'il y avait un nouveau pinceau qui avait des nouvelles modalités."

Pour aller plus loin
- Page sur l'oeuvre de Lynn Herschman Leeson, " Missing Person, Cyborg, 2021", exposée à la biennale de Venise 2022 (site ParisArtNow), citée en haut de page.
- Programmes de création et de transformation d'images : Site de Dall-E 2, site de Midjourney, site de Deep dream generator et Deep dream API et maintenant aussi de vidéos : Gen-1.
- Page d'explication sur le deep learning (apprentissage profond).
- Site de Trevor Paglen, artiste cité. Texte (en anglais) de Trevor Paglen, Invisibles images (Your pictures are looking at you), en 2016.
- Page sur l'exposition " From Apple to Anomaly" de Trevor Paglen (Barbican center, Londres, 2019).
- A lire, un article sur Deep dream (site intelligence-artificielle.com, 2021), " Google Deep dream : guide complet d'une IA hallucinante".
- A lire aussi, un article sur le réseau GAN (site lebigdata.fr, 2020), " GAN ou réseau antagoniste génératif : qu'est-ce que c'est ?".
- Site de l'artiste Grégory Chatonsky (cité).
- Page sur l'exposition I will survive d'Hito Steyerl, en 2021, au centre Pompidou (citée).
➢ A propos d'Antonio Somaini
- Professeur d'études cinématographiques, études visuelles et théorie des médias à l'Université Sorbonne Nouvelle, et Membre Senior de l' Institut Universitaire de France (IUF). Il travaille actuellement sur l'impact de l'intelligence artificielle sur la culture visuelle et les pratiques artistiques contemporaines. Ses pages, sur le site de l'IUF et sur le site de l'Université Sorbonne Nouvelle.
- Publications récentes, le livre Culture visuelle. Images, regards, médias, dispositifs (écrit avec Andrea Pinotti, Presses du Réel, 2022) et la direction (avec Francesco Casetti) de l'ouvrage collectif La haute et la basse définition des images. Photographie, cinéma, art contemporain, culture visuelle (Éditions Mimésis, 2021).
- Commissaire d'exposition : En 2020, pour l'exposition Time Machine. Cinematic Temporalities (catalogue Skira).

➢ A propos de Matthieu Cord
- Professeur à Sorbonne Université, chercheur en vision artificielle, intelligence artificielle et deep learning. Ses pages, sur le site ISIR et sur son site personnel.
- Sa thèse et ses directions de thèse sur le site theses.fr
- Ses dernières publications académiques sont disponibles à partir de son site.
- Son intervention pour l'article d'Usine Nouvelle : "Dans la foulée de ChatGPT, l'IA générative se démocratise pour le meilleur et pour le pire".

Extraits musicaux
- " The desert music - Three movements" (2011) de Steve Reich.
- " Schisme" (1980) et "Amour foot" (1998) de Pierre Henry.
L'équipe
- Production
- Réalisation
- Collaboration
- Collaboration