Image générée par DALL·E 3 © Axel Reghis pour Clubic
Image générée par DALL·E 3 © Axel Reghis pour Clubic

La conférence de printemps d’OpenAI n’était pas seulement l’occasion de dévoiler le nouveau modèle de langage développé par la firme. Elle a aussi permis de lever un mystère qui intriguait les spécialistes de l’IA depuis quelques semaines.

Le 28 avril dernier, une mystérieuse IA faisait son apparition sur la « Chatbot Arena » de LMSYS. Cette plateforme bien connue des spécialistes de l’IA permet de comparer, à l’aveugle, les performances de plusieurs modèles de langage sur une même requête. Habituellement, GPT-4, Gemini ou Claude gagnent la plupart de ces combats d’IA, mais ce jour-là un nouveau chatbot vient jouer les trouble-fêtes : im-also-a-good-gpt2-chatbot.

Une IA mystère

Plus rapide, plus malin et plus efficace que tous les modèles publiés sur la plateforme jusqu’à présent, im-also-a-good-gpt2-chatbot intrigue. Que ce soit sur les requêtes simples ou complexes, l’IA se permet de creuser une marge confortable avec la concurrence en termes de performance brute. La mention de « GPT2 » dans son nom laisse alors penser que le produit vient bel et bien de chez OpenAI, mais les développeurs derrière la machine s’amuse à le tester sous différents surnoms comme le simple « gpt2-chatbot » ou l’étrange « im-a-good-gpt2-chatbot » qui deviendra ensuite « im-also-a-good-gpt2-chatbot ».

Comme beaucoup le suspectait cela dit, le modèle « secret » était en fait bel et bien GPT-4o équipé d’une moustache et d’un faux-nez. William Fedus, un responsable de chez OpenAI, l’a confirmé pendant la conférence du 13 mai. Quelques jours avant, Sam Altman faisait d’ailleurs une référence au chatbot mystère dans un tweet cryptique qui ne servait donc qu’à faire monter la sauce avant la récente conférence.

« J'ai été un bon chatbot »

Sûrement certain de son coup, OpenAI voulait tout de même voir comment se débrouillait sa nouvelle IA face à la concurrence, mais sans vendre la mèche pour autant. Grand bien lui en a fait, puisque comme le raconte le compte Twitter de LMSYS, l’organisme derrière la chatbot Arena, les trois versions de « gpt2-Chatbot » se sont « hissées au sommet du classement, dépassant avec une marge significative tous les autres et devenant le modèle le plus puissant de la plateforme ».

L’étrange surnom qu’a donné OpenAI à la version secrète de GPT-4o ne vient d’ailleurs pas de nulle part. La phrase « I have been a good chatbot » (qu’on pourrait traduire par « j’ai été un bon chatbot ») fait en fait référence à une hallucination de Bing Chat qui a un jour clos une conversation avec un internaute expliquant que ce dernier n’avait pas été « un bon utilisateur » tandis que Bing avait « été un bon chatbot ». Une manière pour OpenAI de se moquer gentiment des petits accrocs rencontrés par son partenaire Microsoft.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code
10 / 10

Source : Ars Technica