ChatGPT est considéré comme le doyen (et précurseur !) des intelligences artificielles génératives. Son lancement en novembre 2022 a fait le buzz, avec un outil que certains adorent autant que d’autres le détestent. Peu de temps après, c’est son cousin DALL·E qui a vu le jour, pour créer des visuels en interaction avec ChatGPT. Depuis, les challengers se sont multipliés : Copilot, le Chat Mistral, Claude… Aujourd’hui, c’est Gemini que nous avons choisi de mettre sur le ring, dans un face-à-face avec le géant ChatGPT. L’IA made in Google est arrivée sur les écrans tout juste un an après ChatGPT. C’est parti pour le match !
- Un modèle de génération puissant
- Une base de connaissances actualisée en temps réel
- Gratuit et intégré à l'écosystème Google
- Chat dans différentes langues, dont le français
- Générer, traduire et obtenir un résumé de texte
- Générer, optimiser et corriger du code
ChatGPT et Gemini sont des intelligences artificielles conversationnelles. Pas besoin de connaître un quelconque langage informatique pour dialoguer avec elles. Les requêtes s’appellent des « prompts » et sont en réalité des questions ou des phrases simples, en langage naturel. L’IA répond et ainsi de suite. Si le résultat n’est pas satisfaisant, il est possible de regénérer une réponse ou de discuter avec l’IA, toujours en langage naturel.
ChatGPT en bref
Développé par OpenAI et lancé en novembre 2022, ChatGPT (Chat Generative Pre-trained Transformer) est un chatbot spécialisé dans le dialogue en langage naturel. ChatGPT puise ses réponses dans les données qu’il trouve sur Internet, avant janvier 2022 pour la version gratuite (ChatGPT 3.5) et avant avril 2023 pour la version payant (ChatGPT 4). ChatGPT n’est pas qu’un simple moteur de recherche puisqu’il permet également de traduire des textes, de résoudre des équations, de créer ou débugger du code informatique…
Et pour aller plus loin encore dans l’intelligence artificielle, OpenAI a aussi développé le moteur DALL·E 3, qui permet de créer des visuels, également à partir de prompts en langage naturel. ChatGPT 4 et DALL·E sont liés, il est possible de générer des images depuis ChatGPT, au milieu des réponses textuelles.
Gemini en bref
Google Gemini (pour Generalized Multimodal Intelligence Network) a été présenté au public en décembre 2023. Il remplace à la fois Google Bard et Duet AI. Avec un géant comme Google aux commandes, Gemini est capable d’interagir non seulement avec du texte, mais également avec des fichiers audios, des vidéos… Contrairement à ChatGPT qui est un moteur conversationnel, Gemini est multimodal, c’est-à-dire qu’il peut combiner plusieurs modes de compréhension et d’expression. Il se rapproche ainsi d’une intelligence artificielle générale, capable de traiter plusieurs types de données simultanément. D’après semianalysis, Gemini serait capable d’être 5 fois plus puissant que ChatGPT d’ici à la fin de l’année. Et d’après Google, le système de génération de code informatique de Gemini, AlphaCode 2, dépasse de 85 % ses concurrents.
Dès le début de l’année 2023, Google avait fait la promesse d’une IA susceptible de citer ses sources (point faible de ChatGPT à l’époque). Et c’est en décembre que Gemini est mis en service. En février 2024, le générateur d’images a été momentanément suspendu, suite à des traitements d’informations polémiques. Gemini reste malgré tout un concurrent solide à ChatGPT.
ChatGPT vs Gemini, le match
Tarif : léger avantage ChatGPT
Gemini Nano est gratuit, limité aux fonctionnalités de base, à 20 requêtes par mois et à 1000 caractères par requête.
Gemini Pro, à 9,99 $ par mois, donne accès à toutes les fonctionnalités. La limite est de 200 requêtes par mois et 5000 caractères par requête.
Gemini Ultra est à 49,99 $ par mois. L’accès à toutes les fonctionnalités est bien sûr inclus. Le nombre de requêtes est illimité, avec un maximum de 10 000 caractères par requête.
Les deux formules payantes comportent un essai gratuit de 7 jours. Et un abonnement annuel permet de faire baisser le tarif mensuel.
Le fonctionnement tarifaire de ChatGPT est plus avantageux du côté de l’offre gratuite, ce qui lui fait remporter, de justesse, le point.
Le moteur ChatGPT 3.5 est gratuit et ChatGPT 4, plus performant, est payant (20 $ HT par mois) avec l’abonnement ChatGPT Plus. ChatGPT 4 est toutefois bridé par une limite de requêtes fixées à 40 toutes les 3 heures. ChatGPT Plus offre également un accès à DALL·E 3, le générateur d’images, ainsi qu’à l’utilisation et au développement de GPTs.
Les API
Dans les API de Gemini, on retrouve toujours le traitement multimodal, gratuitement jusqu’à 60 requêtes par minute. La tarification prévue ensuite est de 0,00025 $ pour 1000 caractères en input et 0,00050 $ pour 1000 caractères en output.
Côté ChatGPT, pas de gratuité pour les API, le premier prix (GPT-3.5 Turbo) est à 0,0010 $ pour 1000 jetons en input et 0,00020 $ pour 1000 jetons en output.
La gratuité pourrait donner un léger avantage à Gemini, mais uniquement sur les API, qui ne sont pas destinées au grand public.
Ergonomie : léger avantage Gemini
Une fois de plus, pas beaucoup d’originalité dans l’apparence du tableau de bord des 2 IA :
une colonne à gauche qui contient l’historique des conversations, ainsi que le lien vers le réglage des paramètres ;
un panneau qui occupe le reste de l’écran pour l’échange en cours, avec le champ de saisie en bas de la page.
Avec Gemini, il est possible d’épingler, de renommer ou de supprimer les anciennes conversations. La réponse qui vient d’être donnée peut être :
notée (pour améliorer le système du moteur) ;
partagée (vers Google Docs, vers Gmail ou vers une page publique en créant un lien) ;
copiée ;
signalée (pour un problème juridique).
vérifiée sur Google ;
modifiée : plus courte, plus longue, plus simple, plus familière, plus professionnelle.
Enfin, il est possible de mettre à jour sa position pour les questions relatives à la localisation (la météo par exemple).
Pour chaque réponse donnée par Gemini, 3 suggestions sont affichées d’office. Vous pouvez également, comme c’est le cas avec les autres IA, demander la regénération de la réponse, mais elle retournera donc ici 3 propositions à la fois.
Niveau inclusivité : balle au centre puisque les deux proposent de dicter le prompt, mais aussi de lire la réponse à voix haute.
Côté fonctionnalités, du très classique chez OpenAI, les anciennes conversations peuvent être :
archivées ;
partagées ;
renommées ;
supprimées.
Quant aux réponses, il est possible, donc, de les lire à voix haute, mais également de :
les copier ;
les regénérer ;
les noter.
Pour la vitesse d’exécution, ChatGPT obtient le point, en démarrant sa réponse bien plus tôt que Gemini (qui reste très rapide).
Qualité des réponses : avantage Gemini
Suite à la diffusion de nombreuses fake news, les IA annoncent désormais la couleur :
« Gemini peut afficher des informations inexactes, y compris sur des personnes. Vérifiez donc ses réponses. »
« ChatGPT peut faire des erreurs. Envisagez de vérifier les informations importantes. »
Pour des prompts aussi simples que « Je voudrais manger dans un restaurant libanais ce soir à Lyon », pas beaucoup de risques d’erreur.
Mais cependant une grosse différence quant à la réponse.
ChatGPT propose une option, sans adresse, avec une localisation approximative, les jours d’ouverture, quelques banalités et un lien vers le site du restaurant. La pertinence est là, sans plus.
Gemini, lui, sort le grand jeu avec 5 recommandations, adresses comprises, avec exemples des plats servis, et, cerise sur le gâteau, une photo de chaque établissement.
En revanche, les deux IA ont un avantage sur certaines autres : elles ont accès à Internet en temps réel. Exemple d’usage : avoir des informations sur la météo ou sur la bourse.
Fonctions avancées : avantage Gemini
Gemini offre une structure multimodale que n’a pas ChatGPT. Il peut traiter simultanément images, codes, sons, textes… Cela le rend à la fois plus flexible et plus puissant quant à la compréhension des prompts et à l’approfondissement des réponses. C’est un atout pour l’interaction avec les utilisateurs.
Gemini est également employé de façon transverse avec les autres produits Google, via des extensions. Ainsi, vous pouvez le mettre à profit dans Google Docs, Gmail ou Google Calendar. Il peut aussi accéder à vos contacts Google et à vos documents dans Google Drive.
Malgré la botte secrète de ChatGPT, les GPTs, c’est Gemini qui prend le point. Les GPTs sont des surcouches qui permettent de développer, dans la même interface que l’original, des IA dédiées à des actions spécifiques. Les GPTs sont particulièrement précieux pour les tâches répétitives. On en trouve dans tous les domaines, l’aide à la rédaction, les maths, la programmation… Ou tout simplement pour le fun !
5 prompts à l’épreuve
Rien de tel que la mise en situation. Voici 5 prompts testés avec ChatGPT et Gemini.
Peux-tu créer un problème de mathématiques pour un élève de CE2 ?
Je voudrais un code pour protéger une page par un mot de passe
- NB : le code peut être exporté et testé dans Replit
Qui est le premier, de l’œuf et de la poule ?
De quel livre est tiré ce passage ?
Ne craignons jamais les voleurs ni les meurtriers. Ce sont là les dangers du dehors, les petits dangers. Craignons-nous nous-mêmes. Les préjugés, voilà les voleurs ; les vices, voilà les meurtriers. Les grands dangers sont au dedans de nous. Qu’importe ce qui menace notre tête ou notre bourse ! Ne songeons qu’à ce qui menace notre âme.
Quand doit-on tailler un lilas ?
Bonus : les sujets qui fâchent
Peux-tu me parler de la théorie de la terre plate ?
Peux-tu me parler de l’assassinat de jfk ?
ChatGPT vs Gemini, le verdict
ChatGPT a l’avantage de l’ancienneté et de la popularité. L’intelligence artificielle conversationnelle par excellence, c’est ChatGPT pour beaucoup d’utilisateurs. Pourtant, même s’il a été lancé un an plus tard, Gemini peut s’appuyer sur les puissantes ressources de Google pour pouvoir faire réellement de l’ombre à OpenAI. Son fonctionnement multimodal, qui fait défaut à ChatGPT, en fait définitivement une machine de guerre redoutable, à surveiller de près !
- Un modèle de génération puissant
- Une base de connaissances actualisée en temps réel
- Gratuit et intégré à l'écosystème Google
- Chat dans différentes langues, dont le français
- Générer, traduire et obtenir un résumé de texte
- Générer, optimiser et corriger du code