Par Souhir Lahiani*
L’intelligence artificielle (IA) a émergé comme une force transformative, une technologie révolutionnaire dans de nombreux domaines, et la photographie n’échappe pas à cette technologie.
Des modèles d’IA générateurs d’images se sont imposés tels que Midjourney, DALL-E 3, Stable Diffusion, Imagen 2, et ont ouvert de nouvelles perspectives dans la création visuelle, bouleversant les frontières traditionnelles en offrant de nouvelles façons de photographier. L’IA a pu transcender les limites établies, pour ouvrir de nouveaux champs d’exploration et remodeler les normes existantes afin de créer des opportunités et des progrès.
Ces avancées technologiques ont suscité un débat sur la façon dont l’IA interagit avec la photographie, une forme d’expression artistique initialement fondée sur la capture de la réalité à travers la lumière. Plusieurs interrogations autour de l’usage éthique de l’IA dans la création artistique et son influence sur l’appréciation de l’art photographique se posent : qui possède les droits d’auteur sur une image générée par l’IA ? Comment l’IA va-t-elle transformer l’industrie de la photographie à l’avenir ? Faut-il avoir peur de l’IA ? S’agit-il d’une atteinte aux droits des photographes ?
L’invention de la photographie : documenter la réalité de manière fidèle
À son invention, le 19 août 1839 par Louis-Jacques-Mandé Daguerre (1787-1851), premier procédé photographique surnommé « daguerréotype », on arrivait à obtenir une reproduction directe et précise de la réalité. Cette invention franchit les frontières dès septembre 1839, et la photographie a permis d’obtenir des images précises et détaillées, ouvrant la voie à une nouvelle ère de documentation visuelle. Cependant, au fil du temps, elle est devenue bien plus qu’une simple reproduction de la réalité. Les photographes ont exploré différentes techniques, styles et approches pour exprimer leur créativité, leur vision et leur interprétation du monde.
Au fil des années, la photographie est devenue une forme d’art à part entière, offrant une palette infinie de possibilités créatives. Cet art a été utilisé pour transmettre des émotions, raconter des histoires, explorer des perspectives uniques et repousser les limites de la perception visuelle : de la photographie documentaire à la photographie conceptuelle en passant par le photojournalisme, la photographie de rue, le portrait, la nature morte et bien d’autres formes créatives.
L’émergence de l’IA dans la photographie : nouvelles formes de visualisation et de manipulation d’images
Au fil du temps, la photographie a évolué bien au-delà de sa fonction documentaire initiale (le daguerréotype), elle s’est transformée en une forme d’expression artistique complexe, capturant non seulement la réalité mais aussi, l’imagination et la vision de l’artiste. Avec l’émergence de l’IA, des programmes tels que « Midjourney », « DALL-E », et « Stability Diffusion » ont généré de nouvelles formes de visualisation et de manipulation d’images, redéfinissant ainsi les frontières de la créativité photographique.
L’IA comme Outil créatif…repousser les limites de la perception visuelle
L’émergence d’outils liés à l’intelligence artificielle visuelle générative (IAVG) a révolutionné, à partir d’algorithmes généralement appelés Generative Adversarial Networks (GAN) ou Variational Autoencoders (VAE), la production d’œuvres artistiques de haute qualité dans des domaines aussi variés que les arts visuels, l’art conceptuel, la musique, la littérature, la vidéo et l’animation. Ces capacités génératives ouvrent donc inévitablement la voie à un repositionnement des processus créatifs utilisés par les artistes pour donner vie à leurs idées (Pierre Fraser, 2023).
Sans utiliser le moindre appareil photo, tout le monde peut désormais collaborer avec des systèmes d’intelligence artificielle pour générer en quelques secondes des images simulant des photographies pouvant dépeindre des personnes et des lieux n’ayant jamais existé, et donc altérer notre perception du réel.
Les artistes intègrent l’IA dans leur processus de création, explorant ses capacités à générer des idées, à repousser les limites de la perception visuelle et à collaborer avec l’humain pour produire des œuvres uniques. Techniquement, l’IA offre la possibilité d’effectuer des retouches (un logiciel de retouche photo alimenté par l’IA peut retoucher jusqu’à des centaines de photos en seulement quelques minutes), d’harmoniser le rendu d’une image, à l’échelle de l’ensemble d’un reportage photos par exemple. Elle permet aux photographes professionnels d’innover et d’élargir leur expression artistique.
Le meilleur exemple, Franck Lecrenay, premier photographe professionnel français à recevoir le prestigieux prix européen Golden Camera, en avril 2023, à Prague, dans la catégorie « Digitally Created Images », une catégorie récompensant les créations avec des intelligences artificielles. Lecrenay a aussi remporté trois titres lors du Salon de la photographie à Paris, en octobre 2023, dans la catégorie « création numérique ».
Faut-il avoir peur de l’IA ? Défis et éthique de l’IA dans la photographie
De nombreux artistes et photographes accusent les systèmes d’IA d’exploiter injustement les œuvres de centaines de milliers de créateurs humains sur lesquels les systèmes sont formés, certains ayant même lancé des poursuites judiciaires. Un porte-parole de l’Organisation mondiale de la photographie a noté son intérêt pour «les possibilités créatives des générateurs d’IA», tout en «soulignant que l’image repose fortement sur sa richesse de connaissances photographiques».
Plusieurs experts de l’industrie photographique s’interrogent sur qui détient les droits d’auteur d’une image d’IA, explorant ainsi les questions de propriété intellectuelle, d’authenticité de l’image et d’impact sur la perception de la réalité visuelle. L’IA a généré une série de questions éthiques et juridiques sans réponse.
Deepfakes, appropriation non créditée d’œuvres existantes : les abus des modèles d’IA générative
Les deepfakes sont des contenus multimédias synthétiques, souvent des vidéos, générés par des algorithmes d’intelligence artificielle (IA) avancés. Ils utilisent la technique du « deep learning » pour superposer ou remplacer le visage et parfois la voix d’une personne dans une vidéo existante par celles d’une autre personne. Ces outils de génération d’images ont été vivement critiqués par les artistes. Ces outils se basent sur des œuvres d’art créées par des humains, récupérées sur le Web, et les utilisent pour créer des remix ou même des reproductions fidèles sans toujours les attribuer correctement. Des plateformes comme Stable Diffusion, Lensa et DALL-E ont toutes suscité des controverses pour cette raison précise. Cette appropriation non créditée d’œuvres existantes soulève des questions sur la propriété intellectuelle et l’éthique dans le domaine de la création artistique, alimentant ainsi un débat sur la façon dont l’IA interagit avec la créativité humaine et les droits des artistes.
Des géants de l’IA générative ont passé des accords pour s’assurer des droits d’utilisation de certains contenus, mais la grande majorité des données, images, textes ou sons utilisés pour développer des modèles l’a été sans consentement explicite. « J’envisage vraiment de retirer mes œuvres en ligne d’endroits comme ArtStation si l’intérêt de créer de l’art est perdu, et que tout ce à quoi notre travail est bon est d’être introduit dans une machine, pour être maltraité et «frankensteinisé» dans quelques visuels d’IA », a déclaré Suzanne Helmigh, directrice artistique chez Ghostfire Gaming, sur le réseau social X (ancien Twitter).
Exemples de logiciels protégeant les artistes face au plagiat par l’IA
En 2020, des chercheurs de l’Université de Chicago ont développé un outil d’altération des images, nommé Fawkes, destiné à faire dérailler la reconnaissance faciale. Problème : l’outil n’est pas encore abouti, et il faudrait généraliser son utilisation pour le rendre efficace. Ces chercheurs n’ont pas baissé les bras, ils ont créé en mars 2023, Glaze, un logiciel se servant de travaux antérieurs destinés à perturber la reconnaissance faciale. «Nous essayons de fournir les outils technologiques pour protéger les créateurs humains contre les abus des modèles d’IA générative», explique Ben Zhao, professeur d’informatique et chercheur à l’Université de Chicago. «On a travaillé à toute vitesse, parce que nous savions que le problème était grave», raconte Ben Zhao. «Beaucoup de gens étaient en souffrance.»
De son côté, Shawn Shan, l’étudiant chargé de Glaze ajoute « Nous travaillons sur les questions de sécurité et de confidentialité des systèmes d’IA, mais d’habitude nous travaillons plutôt sur des outils au cas où tel ou tel problème se poserait. Cette fois-ci, le problème existe déjà, cela entraîne des dommages réels pour les artistes, ils ont besoin d’outils pour les protéger ».
Tirant la sonnette d’alarme, l’illustratrice américaine Paloma McClain s’est tournée vers le logiciel libre Glaze, après avoir appris que plusieurs modèles d’IA avaient été « formés » à l’aide de son art, sans qu’aucun crédit ni compensation ne lui soient envoyés. « Cela m’a dérangé, je crois que les progrès technologiques véritablement significatifs se font de manière éthique et élèvent tous les gens au lieu de fonctionner aux dépens des autres », a déclaré McClain à l’AFP.
Depuis son lancement, Glaze a été téléchargé plus de 1,6 million de fois, selon le chercheur Ben Zhao, dont l’unité s’apprête à lancer un nouveau programme, baptisé Nightshade. Il est axé sur les requêtes en langage courant (prompts) que l’utilisateur d’un modèle d’IA générative soumet pour obtenir une nouvelle image. Il vise à faire dérailler l’algorithme. Protéger aussi la voix.
Autre initiative, celle de la start-up Spawning qui a mis au point Kudurru, logiciel qui détecte les tentatives de collecte massive sur des plateformes d’images.
« L’artiste a alors le choix de bloquer l’accès à ses travaux ou d’envoyer une autre image que celle qui était demandée, «ce qui revient à empoisonner» le modèle d’IA en développement et d’affecter sa fiabilité », décrit Jordan Meyer, cofondateur de Spawning.
Spawning a également créé “Have I Been Trained?” (haveibeentrained.com), un site qui permet de savoir si des images ont alimenté un modèle d’IA et d’offrir à leur propriétaire la possibilité de les protéger contre de futures utilisations non autorisées.
Logiciels AntiFake
De nombreuses discussions émergent autour de la réglementation et de la prévention des abus potentiels des deepfakes. Tiffany Hsu a mentionné dans New York Times au début de l’année 2023, que “le volume croissant de deepfakes pourrait conduire à une situation où les citoyens n’ont plus de réalité partagée, ou pourrait créer une confusion sociétale sur les sources d’information fiables”, une situation parfois appelée “apocalypse de l’information” ou “apathie de la réalité”, selon un rapport de 2022 de l’agence européenne chargée de l’application de la loi, Europol.
Au-delà de l’image, des chercheurs de l’université de Washington à St. Louis (Missouri) se sont intéressés au son et ont mis au point AntiFake. Ce logiciel enrichit un fichier son de bruits supplémentaires, imperceptibles à l’oreille humaine, qui rendent impossible l’imitation crédible d’une voix humaine, précise Zhiyuan Yu, thésard à l’origine du projet.
Le programme vise notamment à empêcher les «deepfakes», des montages photos ou vidéos hyperréalistes usant de l’apparence d’une personne, souvent célèbre, de lui faire faire ou dire quelque chose. L’équipe, supervisée par le professeur Ning Zhang, a récemment été contactée par les producteurs d’un podcast à succès qui souhaitaient le protéger de détournements, selon Zhiyuan Yu.
Midjourney, Dall-E, Imagen et Stable Diffusion : comment reconnaître les images générées par l’intelligence artificielle ?
Les images créées par l’IA sont de plus en plus réalistes et détaillées. À tel point que les repérer est loin d’être chose aisée. Il est toutefois ardu de déceler le vrai du faux. Sur la toile et les réseaux sociaux, les contenus journalistiques fiables côtoient de fausses informations sciemment montées en épingle, des images sorties de leur contexte et des campagnes malveillantes visant à tromper les internautes.
À cet univers déjà complexe, il faut désormais ajouter les générateurs d’images par l’IA comme Midjourney, Dall-E et Stable Diffusion. Leur fonctionnement ? En se basant sur vos instructions, ces programmes sont capables de générer des images en puisant dans de gigantesques bases de données. À vocation artistique, les générateurs sont toutefois de plus en plus détournés pour troller ou, dans le pire des cas, manipuler l’opinion.
Le 20 mars 2023, des images montrant une supposée arrestation de l’ex-président des États-Unis Donald Trump circulent sur les réseaux sociaux. D’autres représentent le président français Emmanuel Macron lui aussi arrêté par la police, ramassant les poubelles ou bien manifestant. Ces exemples montrent comment les images générées par l’IA peuvent répandre des informations erronées avec toutes les conséquences néfastes que cela implique.
Il existe heureusement quelques astuces pour parvenir à démêler le vrai du faux. “Ce qui est vraiment efficace, c’est ce qu’on appelle la recherche inversée qui permet d’analyser la provenance”, explique à Tom’s Guide Vincent Terrasi, cofondateur de Draft & Goal, startup qui a lancé un détecteur de contenus créés par l’IA.
L’IA présente « des risques majeurs pour l’humanité »
L’IA présente «des risques majeurs pour l’humanité», selon plusieurs experts, dont Elon Musk, propriétaire de Twitter et fondateur de SpaceX et de Tesla, et Yuval Noah Harari, l’auteur de Sapiens. De son côté, Yoshua Bengio, pionnier canadien de l’IA, a exprimé ses préoccupations lors d’une conférence de presse virtuelle à Montréal : « Je ne pense pas que la société soit prête à faire face à cette puissance-là, au potentiel de manipulation par exemple des populations qui pourrait mettre en danger les démocraties. » « Il faut donc prendre le temps de ralentir cette course commerciale qui est en route », a-t-il ajouté, appelant à discuter de ces enjeux au niveau mondial, «comme nous l’avons fait pour l’énergie et les armes nucléaires».
Sam Altman, patron d’OpenAI, concepteur de chatGPT, a lui-même reconnu être « un petit peu effrayé » par sa création si elle était utilisée pour de «la désinformation à grande échelle ou des cyberattaques». « La société a besoin de temps pour s’adapter », avait-il déclaré au média ABC News le 15 mars 2023.
« Ces derniers mois ont vu les laboratoires d’IA s’enfermer dans une course incontrôlée pour développer et déployer des cerveaux numériques toujours plus puissants, que personne – pas même leurs créateurs – ne peut comprendre, prédire ou contrôler de manière fiable », estime Sam Altman.
Pistes et horizons…
L’intelligence artificielle a considérablement transformé la pratique de la photographie, offrant de nouvelles avenues créatives tout en suscitant des débats essentiels sur son rôle, ses limites et son impact éthique. Cette évolution continue de redéfinir la manière dont les photographes et les spectateurs perçoivent et interagissent avec l’art visuel, ouvrant ainsi la voie à une ère fascinante de fusion entre technologie et créativité artistique.
Dans un futur proche, l’IA sera probablement capable non seulement de créer des images et des vidéos réalistes, mais aussi de véritables contenus médiatiques, par exemple des films, des séries TV et des programmes tels que des émissions de télé-réalité ou des quiz (Cappello, 2020).
« Nous sommes à un tournant fondamental dans notre perception du réel et du possible. Il est urgent de comprendre ce qui est en jeu et de développer les meilleures pratiques pour préserver et amplifier ce que l’on veut que les médias soient capables d’accomplir », atteste Fred Ritchin, professeur, auteur et co-directeur du programme NYU/Magnum Foundation Photography and Human Rights Educational.
(A suivre…)
*Docteure en sciences de l’information
et de la communication
1 Midjourney se positionne comme leader de la génération d’images avec une intelligence artificielle. Sa version bêta a été lancée en juillet 2022. Il n’existe pas d’interface propre à cet outil, il doit être utilisé sur un serveur Discord.
2 OpenAI a officialisé en octobre 2023, la troisième version de son générateur d’images, DALL-E 3, qui gagne sensiblement en précision. Il est possible d’en profiter gratuitement en passant par Bing Chat, le célèbre chatbot de Microsoft.
3 Stable Diffusion est un modèle de machine learning créé par l’université de Munich, en collaboration avec les sociétés Runway et Stability AI. La première version est sortie en août 2022, dans le sillage de DALL-E et de Midjourney. Contrairement à cette dernière, Stable Diffusion est open source et gratuit.
4 Google Cloud vient de présenter en décembre 2023, Imagen 2, une technologie qui permet de créer des images à partir de descriptions textuelles. Cette innovation est basée sur les recherches de Google DeepMind et pourrait bien concurrencer les autres générateurs d’images comme DALL-E 3.
5 Louis-Jacques-Mandé Daguerre est un peintre, physicien et photographe français.
6 En intelligence artificielle, les réseaux antagonistes génératifs parfois aussi appelés réseaux adverses génératifs sont une classe d’algorithmes d’apprentissage non supervisé. Ces algorithmes ont été introduits par Goodfellow et al. 2014.
7 En apprentissage automatique, un auto-encodeur variationnel, est une architecture de réseau de neurones artificiels introduite en 2013 par D. Kingma et M. Welling, appartenant aux familles des modèles graphiques probabilistes et des méthodes bayésiennes variationnelles
8 Fraser P. (2024-03), « La génération d’images par l’IA signale-t-elle la fin de l’Art ? », Sociologie Visuelle, n° 5, éds. Pierre Fraser et Georges Vignaux, Québec : Photo|Société.
9 Article publié par Paul Glynn, journaliste spécialisé dans le divertissement, dans BBC news Afrique, le 18 avril 2023.
10 Les artistes se révoltent contre les œuvres d’art générées par l’IA sur le site de portfolios ArtStation et inondent la plateforme d’images portant le message : « non aux images générées par l’IA » (developpez.com), article publié le 21 décembre 2022 par Bill Fassinou.
12 Un essai de Fred Ritchin, professeur, auteur et co-directeur du programme NYU/Magnum Foundation Photography and Human Rights Educational., PAR PHOTOVOGUE, 16 novembre 2023.
13 L’IA présente « des risques majeurs pour l’humanité », selon Elon Musk et des experts (lepoint.fr), publié le 29/03/2023.
14 Cappello M. (Ed.), IRIS Spécial 2020-2, L’intelligence artificielle dans le secteur audiovisuel, IRIS Spécial,
Observatoire européen de l’audiovisuel, Strasbourg, 2020.