© Shutterstock
© Shutterstock

Le patron d'Amazon, Andy Jassy, affirme que l'entreprise travaille déjà depuis longtemps sur des modèles d'intelligence artificielle générative comme celui d'OpenAI, ChatGPT.

Une telle annonce est-elle si surprenante ? Sur le secteur bondissant des IA génératives, chacun essaie de montrer ses muscles (Microsoft dope son navigateur Bing ; Google a présenté son chatbot Bard), et il n'est pas étonnant de voir Amazon nous gratifier de quelques éléments nous montrant, oui, que le géant du e-commerce peut tout à fait lui aussi dégainer son propre ChatGPT.

Un nouveau modèle d'IA, basée sur une approche multimodale

Dans une interview donnée à nos confrères américains du Financial Times, Andy Jassy, qui a succédé à Jeff Bezos à la tête d'Amazon, a expliqué que le roi du commerce en ligne travaille « depuis longtemps » sur des modèles de robot conversationnel boosté à l'IA du type ChatGPT.

Des chercheurs de la branche cloud de la firme, Amazon Web Services, ont d'ailleurs mis en ligne, sur la plateforme ouverte d'articles scientifiques arXiv, des documents et du code présentant un tout nouveau modèle de langage, baptisé Chain-of-Thought (CoT), que l'on pourrait littéralement traduire par chaîne ou fil de pensée, via un modèle qui assimilerait plusieurs étapes de raisonnement pour déduire et apporter des réponses.

L'IA développée par Amazon adopterait une approche multimodale, qui lui permettrait à la fois de fusionner les caractéristiques de la vision (donc les images) et du langage (le texte, la parole). Un tel modèle réduirait de manière significative les fameuses « hallucinations », ces réponses erronées aux requêtes lancées au chatbot.

L'IA générative d'Amazon, plus forte que celle d'OpenAI, surpasse même les performances humaines

Les chercheurs d'Amazon expliquent que leur IA conversationnelle à l'approche multimodale surpasserait, en matière de résultats à des questions à choix multiples, de 16 % le modèle GPT 3.5 que l'on retrouve actuellement dans le chatbot ChatGPT, avec un score de 91,68 % pour l'intelligence artificielle d'Amazon, contre 75,17 % de bonnes réponses pour celle qui alimente le robot d'OpenAI actuellement. L'IA de la firme au sourire fait même mieux que les humains, qui présentent une moyenne de 88,4 %.

Sur la première ligne (colonne Avg), le résultat moyen obtenu par les humains. En bas, les résultats de GPT 3.5, qui alimente ChatGPT, et ceux de la méthode privilégiée par Amazon, "Multimodal-COT" © arXiv
Sur la première ligne (colonne Avg), le résultat moyen obtenu par les humains. En bas, les résultats de GPT 3.5, qui alimente ChatGPT, et ceux de la méthode privilégiée par Amazon, "Multimodal-COT" © arXiv

Là où l'IA d'Amazon est brillante, c'est en obtenant ces étonnants résultats en jonglant entre 738 millions de paramètres seulement (colonne Size du tableau), contre 175 milliards pour GPT 3.5. Et sur un modèle encore plus léger en paramètres (223 millions, avant-dernière ligne du tableau), l'intelligence artificielle du e-commerçant obtient un score de 84,9 %, bien supérieur donc aux deux modèles GPT 3.5 testés.

Aujourd'hui, l'IA est déjà omniprésente dans les activités d'Amazon, que ce soit chez AWS, chez Alexa ou dans son générateur de recommandations de code, CodeWhisperer. L'entreprise développe aujourd'hui de multiples partenariats avec de petites sociétés spécialisées, comme Stability AI, concurrente d'OpenAI. Mais avant de proposer un nouveau modèle d'IA qui serait capable de faire encore mieux que ChatGPT, en développant une connaissance en temps réel par exemple, Amazon veut se concentrer sur le développement et l'amélioration de ses produits actuels, et prendre son temps. Alors vrai potentiel ou coup d'épée dans l'eau pour satisfaire les investisseurs ?

Google Gemini (Bard)
  • Un modèle de génération puissant
  • Une base de connaissances actualisée en temps réel
  • Gratuit et intégré à l'écosystème Google
ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code
Microsoft Bing
  • L'intégration de ChatGPT
  • Filtres pour la recherche d'images
  • Filtres des actualités par sources