Gemini : Google vous a menti sur ses capacités !

Par Naïm Bada, Spécialiste logiciel.

Publié le 17 décembre 2023 à 14h30

Sundar Pichaï dévoile Gemini lors de la conférence Google I/O de 2023 © Google

Les rumeurs courraient depuis presque un an, Gemini est enfin là ! Annoncé comme le tueur de GPT-4 et d'OpenAI, le nouveau modèle de Bard a encore du pain sur la planche.

Sans prévenir, Google a annoncé et sorti cette semaine son nouveau modèle, Gemini. Les performances de Gemini dans les benchmarks sont particulièrement impressionnantes. Selon Google, Gemini Pro a surpassé GPT-3.5 dans la majorité des tests, tandis que Gemini Ultra a devancé GPT-4, le modèle le plus avancé d'OpenAI, dans presque tous les domaines évalués. Ces résultats suggèrent que Gemini pourrait bientôt devenir un acteur dominant dans le domaine des LLM, mais qu'en est-il réellement ?

Une démo fabriquée et un lancement rushé ?

La récente présentation de Google Gemini a suscité un mélange d'étonnement et de scepticisme. Google, désireux de se positionner comme un leader dans ce domaine, a récemment révélé Gemini, son modèle d'intelligence artificielle le plus avancé. Cependant, les révélations concernant la manipulation de sa démo ont soulevé des questions cruciales sur l'intégrité et la transparence de Google dans la course à l'IA.

L'annonce de Gemini par Google a été un moment de triomphe apparent. Ce modèle, présenté comme une avancée majeure, est conçu pour comprendre et combiner divers types d'informations, y compris le texte, les images et les vidéos. Sa capacité à traiter simultanément des données multimodales le positionnait comme une innovation majeure, potentiellement supérieure à des modèles concurrents tels que GPT-4 d'OpenAI.

Le soufflé est cependant rapidement retombé lorsque des critiques et analyses ont révélé que la démo impressionnante de Gemini était en grande partie fabriquée. Selon les rapports, Google a admis avoir raccourci les réponses de Gemini et réduit la latence dans sa vidéo de démonstration pour la rendre plus attrayante. Ces manipulations ont soulevé des inquiétudes quant à la fidélité de la représentation des capacités réelles de Gemini.

...

L'impact de ces révélations est significatif. Elles remettent en question non seulement la capacité de Gemini à effectuer les tâches démontrées, mais aussi la crédibilité de Google dans la présentation de ses avancées technologiques. Dans un domaine où la confiance et la fiabilité sont primordiales, ces actes pourraient affecter la réputation de l'entreprise.

Ces développements surviennent à un moment où la compétition dans le domaine de l'IA est plus féroce que jamais. Des entreprises comme OpenAI ont pris une longueur d'avance avec des modèles tels que GPT-4, qui ont gagné la confiance et l'admiration du public ainsi que de la communauté scientifique. Google, avec Gemini, semblait prêt à rejoindre cette course en tant que concurrent sérieux.

Il est crucial de noter que, malgré ces déboires, Gemini représente toujours un pas en avant potentiel dans le monde de l'IA. Ses capacités multimodales et son approche innovante méritent une reconnaissance et une exploration plus approfondies. Toutefois, pour que Gemini réalise pleinement son potentiel et gagne la confiance du marché, Google doit s'engager dans une communication plus transparente et authentique.

Quid des benchmarks présentés par Google ?

La performance de Gemini dans le test MMLU, un indicateur clé de la performance des modèles de langage à grande échelle, a été mise en doute. Selon les critiques, Gemini aurait surpassé GPT-4 dans ce benchmark spécifiquement en utilisant une méthodologie nommée CoT@32. Or, cette méthode diffère de l'approche standard 5-shot, où GPT-4 maintient une avance avec un score de 86,4% contre 83,7% pour Gemini.

La méthodologie 5-shot, largement reconnue comme la norme pour évaluer ce type de benchmark, implique de préparer l'invite avec cinq exemples. Google, cependant, aurait inventé une approche différente autour de CoT@32 pour revendiquer la supériorité de Gemini. Cette méthode, axée sur un seuil de consensus pour déterminer l'utilisation de la majorité versus le recours à la probabilité maximale, semble optimisée pour des résultats spécifiques plutôt que pour une application réelle.

Les benchmarks publiés par Google dans leur livre blanc couvrent plusieurs domaines @ Google

L'utilisation de LLMs dans le monde réel ne correspond pas à la méthodologie CoT@32, soulevant ainsi des doutes sur l'applicabilité pratique de Gemini par rapport à GPT-4. Des critiques ont émergé sur les plateformes de médias sociaux, avec des utilisateurs exprimant leur déception face à ce qu'ils perçoivent comme une promotion « trompeuse » de Gemini. Ces critiques soulignent l'importance d'une transparence et d'une méthodologie standardisée dans la présentation des benchmarks d'IA. Autre chose importante à noter, les benchmarks ont été fait sur la version de juin 2023 de GPT-4. Entre temps, un certain GPT-4 Turbo bien plus performant a été publié…

Bard avec Gemini, un énième avant-goût de l'intelligence artificielle promise par Google

Pour résumer : la révolution IA promise par Google à la fondation de DeepMind n'est toujours pas là. Bard avait déjà des allures de projet sorti à la va-vite à son lancement plus tôt cette année. Beaucoup attendaient Gemini comme le GPT killer qui offrirait enfin une concurrence crédible à OpenAI, mais force est de constater que Google n'y est pas encore, même s'il s'en rapproche ! En 2024, aucun doute que la firme de Sundar Pichai dépassera son rival, surtout vu le contexte actuel chez OpenAI.

Dans les faits, le Gemini Pro que nous propose Google dans Bard se rapproche de GPT-3.5 dans ses performances. Ajoutez-y l'intégration des services Google et sa connexion persistante au web, et on obtient un package alléchant pour les utilisateurs gratuits de ChatGPT (et quelques services basés sur GPT-3.5 comme Perplexity ou ChatSonic).

Google Gemini (Bard)

Un modèle de génération puissant
Une base de connaissances actualisée en temps réel
Gratuit et intégré à l'écosystème Google

8 / 10

Télécharger

Par Naïm Bada

Spécialiste logiciel

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (9)

toto1234

"aucun doute que la firme de Sundar Pichai dépassera son rival, surtout vu le contexte actuel chez OpenAI. "

Pas d’accord cette conclusion. OpenAI peut encore dépasser Google sur toute l’année 2024 car ils ont l’air d’avoir de la ressource en réserve et leur CEO « accélérationniste » a été conforté.

Aegis

Bon article gâché par l’ajout du putaclick de la fin.
« En 2024, aucun doute que la firme de Sundar Pichai dépassera son rival, surtout vu le contexte actuel chez OpenAI. »

On comprend que Clubic veuille augmenter le nombre de pages visitées mais la phrase insérant le lien est basée sur une opinion. Aucun fait ou donnée supportant cette déclaration n’est présenté.

Est-ce l’auteur qui a fait cet insert? Si c’est un editeur qui s’occupe des titres et inserts pour augmenter la fréquentation, c’est problématique. Cela sacrifie l’aspect journalistique pour favoriser le commercial.

SPH

Ce n’est pas bien de tricher ! Ca décrédibilise un max…

BradLab

Pourquoi avoir triché lors de cette présentation ? Google va-t-il en tirer un quelconque bénéfice que je ne comprends pas ?

bmustang

google serait un gros enfumeur que je me trompe pas

Belgarath

Les grosses têtes de Google, ils les ont trouvés où ? Ces types sont censés être très intelligents, ils les payent cher pour cela. Ils devaient quand même bien se douter que leur enfumage allait leur péter à la figure.

Archeus

C’est un peu comme les réponses de Peter Molyneux aux journalistes, quand on fait de la com, on ne s’occupe pas de l’existant (visiblement) mais de ce qui pourrait être…

Archeus

+1 pour l’arbitraire de la phrase concernant Google et Open AI… J’étais justement venu dans les coms chercher pourquoi ce serait le cas.

Zozoor

« OpenAI ont pris une longueur d’avance avec des modèles tels que GPT-4 » => Nope , GTP se base sur les travaux de DeepMind (google de prime abord (le T vient de là)… le pré-training est aussi issue des travaux de Google ( ce qu’ils ont fait avec la bertologie). OpenAI n’a d’avance que dans sa promotion au grand public

« méthodologie 5-shot, largement reconnue comme la norme pour évaluer ce type de benchmark » => non plus ! On sent quand même le parti pris OpenAI . Les tests X-Shot ont beaucoup de problématiques . Le prompt-programming est une énorme perte de temps, pour justement trouver le prompt qui va permettre de corriger un maximum d’hallucination !
Le COT32 évalue la fiabilité de la réponse après 32 prompts. Que ChatGPT soit moins fort que Gemini dans ce domaine montre le côté borné de celui ci et la difficulté de le finetuné avec la fenêtre de contexte…et au contraire, sa non-application dans des domaines réels autre que que le côté « m’as tu vu » qu’on voit sur toutes les vidéos Youtube !

Par ailleurs, OpenAI est champion de démonstration bullshit (comme la participation aux examens qui révèle justement une contamination ) . Personne ne lui en ai gréé car il a juste été le premier à présenter une version publique…. sauf que :
-Sauf que les autres sociétés avaient des modèles aux puissances similaires et travaillaient dessus en labo et faisait même plus avancer les travaux AI qu’eux (la preuve par le nombre de publication par société : Google est à la base de plus de la moitié des publications scientifique qui ont amené jusque là )
-Sauf que les autres sociétés ne se pressaient pas pour mettre en ligne une IA qui aurait été basés sur une aspiration massive de données. Par contre, pour OpenAI, personne ne dit rien? C’est marrant comme tout d’un coup, la donnée personnelle n’a plus de sens …. (bon on commence à voir des questions légitimes sur la « copie » des styles de peinture et d’art par les IA après aspiration de données…mais ça reste spécifique et rarement traité ici)

De toute façon, Google s’en moque d’OpenAI : leur note interne, fuité depuis des mois, montre qu’ils sont conscient qu’ils vont se faire dépasser…par les modèles open-sources plus petits, testables par des services de R&D ou labo, et permettant une énorme émulsion/recherche . Et les dernières news leur donnent raison (cf Mistral) . ChatGPT ne sera jamais viable ! Le futur est à ce genre de modèle et j’encourage tout ceux qui veulent sortir du kikoulolisme à se pencher sur ceux disponibles sur huggingface !