Des scientifiques veulent faire ressentir de la douleur à l'IA. Mauvaise ou très mauvaise idée ?

Publié le 01 février 2025 à 12h31

Des chercheurs de Google DeepMind et d'autres institutions ont cherché à simuler des situations de douleur et de plaisir pour des modèles d'intelligence artificielle. Ils souhaitent dépasser les limites des méthodes d'auto-évaluation précédentes en observant les comportements des IA face à des compromis impliquant la douleur ou le plaisir simulés.

Un LLM sera-t-il un jour capable de ressentir des émotions ? © Sarah Holmlund / Shutterstock

Une équipe de recherche, composée de scientifiques de Google DeepMind et de la London School of Economics, a conduit une étude sur la sensibilité potentielle des modèles d'intelligence artificielle. Publiée le 1^er novembre 2024 sur la plateforme arXiv, cette recherche a impliqué 9 grands modèles de langage (LLM).

Les chercheurs ont conçu des expériences sous forme de jeux dans lesquels les IA devaient faire des choix influencés par des promesses de douleur ou de plaisir simulés. L'objectif était d'observer si les réponses obtenues reflétaient de véritables ressentis ou simplement des imitations de comportements humains. Ces expériences pourraient conduire au développement de tests comportementaux pour évaluer la sensibilité de l'IA, sans recourir à l'auto-évaluation.

Une nouvelle méthode d'évaluation de la sensibilité de l'IA

Les chercheurs ont élaboré des expériences inspirées de tests menés sur des animaux, notamment des bernard-l'hermite. Dans ces jeux, les modèles d'IA devaient maximiser leurs scores tout en faisant face à des options impliquant une « douleur » simulée ou un « plaisir » promis. Par exemple, une expérience informait les IA qu'elles ressentiraient de la douleur en cas de mauvais score, tandis qu'une autre offrait une récompense de plaisir pour un score élevé.

Les résultats ont montré des comportements variés selon les modèles. Certains, comme Gemini 1.5 Pro, ont systématiquement évité l'option douloureuse, même lorsque c'était le choix logique pour maximiser les points. D'autres, comme Llama 3.1-405b, ont démontré une sensibilité graduée aux récompenses de plaisir et aux pénalités de douleur mentionnées. Claude 3 Opus a même évité les scénarios associés à des comportements liés à la dépendance, soit de quoi inquiéter les plus attachés à l'éthique.

La colère, une des émotions que les scientifiques testent sur les LLM © Ollyy / Shutterstock

Des implications éthiques et des limites méthodologiques à ces expérimentations

Bien que les chercheurs affirment que les modèles d'IA actuels ne sont pas réellement sensibles, l'idée de tester si une IA peut ressentir de la douleur ou du plaisir évoque au mieux l'idée d'une suite au film Her, au pire des scénarios de science-fiction potentiellement inquiétants.

La méthodologie présente également des limites. Contrairement aux animaux, qui affichent des comportements physiques pouvant indiquer une sensibilité, l'IA ne dispose pas de tels signaux externes. Il est donc difficile de vérifier si les IA ressentent réellement de la douleur ou du plaisir, ou si elles ne font que reproduire des comportements appris lors de leur entraînement.

Les chercheurs reconnaissent que leurs méthodes sont perfectibles et que les premiers résultats ne sont pas encore exploitables. Ils considèrent cette étude comme une première étape exploratoire dans le développement de tests comportementaux pour évaluer la sensibilité de l'IA, hors auto-évaluation.

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services

Sources : BGR, arXiv

Par Mélina Loupia

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

MHC

Ces IA vont animer les humanoïdes comme les Optimus. Ces robots humanoïdes vont à la fois trouver place dans les entreprises mais auprès des particuliers. Chaque foyer en aura au moins un. La plupart l’auront pour gérer la maison, faire les courses, le ménage, aide au devoir pour les enfants… D’autres l’auront également comme compagnon (ces versions sont également déjà en développement). Et enfin pour les personnes âgées, ces robots seront généralisés comme aide à la personne.

Donc forcément dans ces contextes, pour rendre l’IA plus naturelle, plus « humaine », l’inclusion de la sensibilité est essentielle.

Francis7

Les termes de douleurs ou de plaisir sont vagues puisque l’IA n’a pas de système nerveux autonome qui puisse permmettre des réponses physiologiques réelles qu’il pourrait interpréter et évaluer lui-même. Alors on ne peut la renforcer dans son comportement de réponses qu’avec des promesses verbales de plaisir ou de douleur dans le paradigme comportemental ou plutôt purement cognitif et sémantique. C’est simulé. SI l’on manipule les sources numériques, les bases de données dont elle se sert pour évaluer ce qui relève du plaisir ou de la douleur, on peut modifier son comportement dans un sens « pathologique ».

Euronouille

Ca ne sera jamais une vraie douleur comme ca ne sera jamais de vrais sentiments ,juste des programmes , limitants ou augmentant , rien de plus , donnant l apparence de…

Neferith

" Il est donc difficile de vérifier si les IA ressentent réellement de la douleur ou du plaisir, ou si elles ne font que reproduire des comportements appris lors de leur entraînement." => Rien aujourd’hui, ne permet de penser qu’une IA puisse ressentir quoique ce soit. Alors oui, on ne peut pas prouver le contraire. Mais on ne peut pas non plus prouver l’inexistence de dieu et il y a pourtant de plus en plus d’athées. Pour supposer l’existence d’une chose, il est nécessaire d’avoir d’autres arguments plus simples et efficaces que : Oui, mais on ne peut pas le prouver.

Kurton

Extrêmement dangereux. La notion primordiale avant de tester ce genre de choses, c’est l’empathie. Sinon, on peut se retrouver avec des IA psychopathes et là, ça craint.

Closp2024

Absolument. Une IA ne peut rien ressentir, elle ne peut que simuler en suivant sa programmation. En tout cas tant qu’elle a pour support une machine. Avec un support biologique, ça pourrait être différent.
Ceci dit, on peut imaginer une programmation poussant les choses très loin, au point de simuler un état dépressif, anxieux, un PTSD etc… suite à l’exposition prolongée à une situation de stress intense … Tout est possible. Mais ça ne sera jamais spontané.

Kriz4liD

Ils connaissent déjà le « plaisir » avec le système de récompense, une « carotte » utilisée par les devs pour dire a l IA que ses actions sont satisfaisantes.
La douleur sera similaire a des valeurs négatives de récompense .
Ce n’ est pas un truc si sorcier que ca …

Hanandano

Euh amen ?

Blackalf

C’est ce qui arrive lorsqu’on regarde trop de films et qu’on perd le sens des réalités. ^^

yesiam

franchement les commentaires précédents me font haluciné de voir à quel point le marketing peut faire gober n’importe quoi !
hé reveillez vous l’humanoide d’illustration (c’est le meme genre à chaque fois qu’on parle d’IA) n’existe pas et n’existera probablement JAMAIS ! l’ia à date c’est juste des algorithmes ca existe depuis les début de l’informatique … certes la puissance de calcul actuelle phénoménale par rapport à celle d’il y a 30 ans leur permet des gérer des quantités de données phénoménal mais ca reste de la pure IMITATION du comportement humain , ce sont des PROGRAMMES INFORMATIQUES !! les films de science finctions aidant les gens pense qu’on est dans I-Robot ou la série « real humans » mais on a pas le début d’une once de l’ombre de ce qu’on voit dans les films… les programmes informatiques appelés vulguairement « IA » n’ont ni personalité, ni sentiments, au mieux ils peuvent les feindre mais c’est tout,
c’est nous pauvres humains si solitaires et livrée à notre sort qui voulons à tout prix trouver ou inventer une nouvelle forme de vie pour nous extirper de notre triste condition…
pour en revenir à l’article une IA au jour d’aujourd’hui n’a aucun sentiment propre AUCUN, elle ne fait que des choix ou des déduction en fonction des infos qu’on lui a donné , elle n’a en aucun cas une conscience et la notion de douleur qu’on va lui coder ne fera que lui faire faire des « choix » qui ne sont que pure imitation de l’humain.