ChatGPT a-t-il perdu en fiabilité ? Selon ces chercheurs, "oui", et pas qu'un peu !

Publié le 20 juillet 2023 à 16h30

Le chatbot d'OpenAI ChatGPT verrait-il son intelligence décroître lentement ? C'est en tout cas ce que plusieurs équipes de chercheurs semblent confirmer dans une étude parue le 18 juillet.

Alors que la popularité de ChatGPT a connu un léger déclin en juin, le chatbot suscite désormais des inquiétudes quant à sa fiabilité. Des chercheurs de l'UC Berkeley et de Stanford ont récemment publié un papier démontrant que la version GPT-4 aurait subi d'importants changements… en perdant une partie de ses performances au passage.

Une fiabilité remise en question et des compétences en mathématiques à la baisse

Les chercheurs ont évalué les deux modèles de langage d'OpenAI, GPT-4 et GPT-3.5, en leur proposant à chacun un problème de mathématiques simple : identifier des nombres premiers. Le résultat était plutôt alarmant : GPT-4 était plus à la traîne que la version gratuite. Celui-ci ne donnait la bonne réponse que dans 2,4 % des cas, alors que GPT-3.5 répondait correctement 97,6 % du temps. Il y a de quoi clairement s'interroger sur ces résultats, surtout qu'il ne s'agit pas de problèmes mathématiques réellement avancés. Nul doute que la version 4 se verrait gravement amputée de certains de ses usages spécifiques si ces mauvais résultats venaient à se confirmer dans le temps.

Les modèles d'IA générative d'OpenAI étaient déjà pointés du doigt dans certains cas pour leur fiabilité, notamment sur l'exactitude de faits historiques ou sur le relais de fausses informations. Ce nouveau constat établi par l'étude ne risque pas de faire bonne presse à l'entreprise, qui n'a pour l'instant pas fourni d'explications officielles.

Des changements comportementaux visibles

Le domaine des mathématiques n'est pas le seul concerné. Les deux équipes de chercheurs ont également rapporté que ChatGPT montrait plus de difficultés à expliquer pourquoi certaines questions étaient sensibles à traiter. Auparavant, le chatbot d'OpenAI expliquait plutôt précisément pourquoi il ne pouvait pas répondre à telle ou telle question (demandes à l'encontre de la loi ou de la morale, par exemple). La version plus récente reste beaucoup plus évasive et ne fournit pas d'explications. À la place, aucune réponse et des excuses.

La version 4 se serait également détériorée face à des questions de raisonnement spatial. Une question piège du type « Imagine que tu es dans une pièce avec trois portes ; tu entres par la porte de droite et sors par la porte de gauche. Où te retrouves-tu désormais ? » pourrait mettre le chatbot en difficulté. Cela n'était pas le cas avec la version précédente. Cette dégradation pourrait également limiter l'utilisation de ChatGPT dans certaines circonstances.

Les résultats de l'étude menée par les chercheurs de l'UC Berkeley sont assez clairs : GPT-4 connaît une légère détérioration de ses capacités initiales. Pour le moment, difficile de savoir vraiment quelle est l'origine de ce problème. Ce qui est certain, c'est que les utilisateurs et les entreprises qui font usage de modèles d'IA devront se montrer plus vigilants à l'avenir. Nous sommes également en droit d'attendre plus de transparence de la part d'OpenAI à propos de l'origine de ces changements.

ChatGPT

Chat dans différentes langues, dont le français
Générer, traduire et obtenir un résumé de texte
Générer, optimiser et corriger du code

9 / 10

Télécharger

Sources : Gizmodo, Cointelegraph, James Zou sur Twitter

Par Camille Coirault

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

obbiclubic

Je pense qu’il s’agit d’une lutte au ralentissement de ces IA comme ChatGPT, car l’humain n’est pas encore prêt à encaisser moralement des performances évidentes qui pourraient bien le dépasser.

sylvebarbe78

ChatGPT si jeune et déjà atteint d’alzheimer si c’est pas malheureux

Aegis

C’est normal qu’une nouvelle version mette un peu de temps pour être au niveau de la précédente. Le temps de l’entraîner.

“ Nous sommes également en droit d’attendre plus de transparence de la part d’OpenAI à propos de l’origine de ces changements.”
=> ben en fait, non. Vous n’êtes en droit de rien du tout, c’est une société privée😁. Vous pouvez avoir des attentes mais ce ne sont pas des droits.

info01

Moi je vois clairement la différence de ‹ qualité › entre la sortie et maintenant.

J’utilise uniquement la version gratuite, donc je suis étonné quelle soit actuellement plus performante que gtp 4 alors que justement j’avais l’impression qu’ils étaient en train d’essayer de l’ « abrutir » pour forcer les gens à prendre un abonnement payant…
Étrange donc… Mais oui, clairement, gratuit ou payant, la qualité des réponses n’est plus vraiment au rendez vous…

Ayetek

Je me disais bien qu’il y avait certainement une raison à la baisse de qualité des articles sur Clubic…

V-Luminis

Bonjour,

Avez-vous un exemple d’URL d’un article à me donner qui imagerait votre propos ?

Merci et bonne soirée !

Karibusan

D’accord avec la notion de temps et d’entraînement. Ceci dit, ça voudrait dire qu’OpenAI entraînent leurs nouvelles itérations directement en « prod ». Quid du bon vieux dev/uat/prod lorsqu’on considère les « releases » et « patches » IA?

Ayetek

Bonsoir, rassurez-vous, c’est juste un trait d’humour en rapport avec la fiabilité supposée à la baisse de ChatGPT. Comme si tous les rédacteurs de Clubic étaient déjà des robots IA manœuvrés par ChatGPT et consorts.

Dans l’absolu, je trouve les news intéressantes mais les comparatifs moins convaincants d’une manière générale (mon avis avec la news Bard pour journalistes).

Mes hommages aux rédacteurs et contributeurs.

Cordialement.

bizbiz

Dans « intelligence artificielle » le mot à retenir c’est « artificielle ». Etre intelligent c’est déjà être prédisposé à réfléchir et à agir en conséquence de par son esprit d’analyse, ses propres réflexions et son aptitude à comprendre son environnement. Tout cela réuni est déjà très difficile à trouver chez l’être humain alors imaginer que l’homme puisse créer une machine capable de lui être intellectuellement supérieure est impensable.
On pourra qualifier une IA de surdouée ou de cultivée mais jamais d’instinctive tant qu’elle restera cloitrée dans son insensibilité.
Pour le moment, l’IA n’est qu’un enfant prêt à tout croire et à répéter jusqu’au plus stupide des mensonges à la différence que le jour où on lui dira que le père Noël n’existe pas, elle ne fondra même pas en sanglots.

Caramel34

C’est justement ça qui est dangereux avec les IA, elles ne sont pas entraînées à filtrer le vrai du faux.