Pour l'heure, ChatGPT est un piètre moteur de recherche

Publié le 04 décembre 2024 à 12h12

Mauvais départ pour SearchGPT. Le moteur de recherche signé OpenAI génère des résultats « imprésivibles » et, dans de nombreux cas, inexacts. Un constat qui risque d'affecter les éditeurs de presse, et augmente le risque de propagation de fausses informations.

SearchGPT commet beaucoup trop d'erreurs, selon une étude. © Ascannio / Shutterstock

Lancé en octobre, SearchGPT est un moteur de recherche entièrement alimenté à l'intelligence artificielle (IA). Son objectif : fournir « des réponses rapides et opportunes avec des liens vers des sources Web pertinentes ».

Dans l'optique de « mieux comprendre les conséquences des choix auxquels les éditeurs de presse sont désormais confrontés », le Tow Center for Digital Journalism, un centre de recherche et de développement au sein de l'École de journalisme de l'Université Columbia, a enquêté sur les résultats produits par le modèle. Et leurs conclusions sont peu reluisantes.

La plupart des réponses générées sont incorrectes

Les chercheurs ont demandé à l'outil d'identifier la source de 200 citations provenant de 20 médias différents. Parmi eux, certains ont des accords avec OpenAI, permettant à l'entreprise d'utiliser leur contenu dans ses résultats de recherche contre rémunération. D'autres sont impliqués dans un procès avec la société, à l'instar du New York Times, quand les derniers ne sont pas affiliés.

Dans 153 cas, SearchGPT a fourni des réponses partiellement ou totalement incorrectes, mais il n'a reconnu que 7 fois son incapacité à répondre correctement à la demande. « Ce n'est que dans ces sept résultats que le chatbot a utilisé des mots et expressions qualificatifs tels que "semble", "c'est possible" ou "pourrait", ou des déclarations telles que "je n'ai pas pu localiser l'article exact" », précisent les auteurs de l'étude.

Contrairement aux moteurs de recherche traditionnels qui indiquent clairement quand ils ne trouvent pas de sources, l'intelligence artificielle d'OpenAI préfère inventer des réponses plutôt que d'admettre son ignorance, déplorent-ils. Autre fait préoccupant, l'outil génère des réponses différentes à des requêtes identiques, posées à plusieurs reprises. Un phénomène qui serait issu des paramétrages de GPT-4o, estiment les chercheurs, le modèle étant conçu pour être imaginatif.

Les chercheurs estiment que les paramètres de GPT-4o le poussent à imaginer des réponses. © Shutterstock

Mise en avant de contenus plagiés

Ce n'est pas tout. SearchGPT soulève également des questions relatives au plagiat. À plusieurs reprises, l'IA a cité des sources secondaires au lieu des articles originaux. Lorsqu'il lui a été demandé d'identifier la source d'une citation tirée d'un article du New York Times sur les baleines en voie de disparition, elle a renvoyé un lien vers un autre site, qui avait entièrement plagié l'article. Ceci est d'autant plus problématique que le média américain a spécifiquement interdit à OpenAI d'utiliser ses articles dans ses résultats de recherche.

« Cela interroge quant à la capacité d'OpenAI à filtrer et à valider la qualité et l'authenticité de ses sources de données, en particulier lorsqu'il s'agit de contenus non licenciés ou plagiés », commentent les experts.

Les médias qui autorisent les webcrawlers (logiciels d'indexation qui parcourent le Web automatiquement pour collecter des informations) de l'entreprise ne sont pas épargnés, SearchGPT attribuant la source d'un article du MIT Tech Review à un site qui l'avait repris dans son intégralité.

L'interface de SearchGPT. © Capture d'écran / OpenAI

Les organes de presse impuissants

Un porte-parole d'OpenAI a qualifié la méthode de test du Tow Center d'« atypique ». « Nous soutenons les éditeurs et les créateurs en aidant les 250 millions d'utilisateurs hebdomadaires de ChatGPT à découvrir des contenus de qualité grâce à des résumés, des citations, des liens clairs et des attributions », a-t-il déclaré.

Mais les répercussions pour les organes de presse pourraient être considérables. Non seulement leurs contenus sont utilisés sans contrôle réel, mais la façon dont ils sont présentés risque de brouiller leur identité et leur travail journalistique. Comme le souligne Mat Honan du MIT Tech Review, les éditeurs disposent de très peu de leviers pour faire valoir leurs droits, et se trouvent impuissants face à cette technologie qui transforme la diffusion de l'information. Et les choses risquent d'empirer, ce type de solution continuant de rapidement se développer.

De son côté, OpenAI s'est engagée à « continuer à améliorer les résultats de recherche ».

À découvrir

Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025

30 décembre 2024 à 11h18

Comparatifs services

À découvrir

Quels sont les meilleurs moteurs de recherche ? Comparatif 2025

22 janvier 2025 à 12h13

Comparatifs services

Source : Colombia Journalism Review

Par Mathilde Rochefort

OpenAI

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

mamide

Moi je m’étonne toujours comment les gens peuvent utiliser ChatGPT pour leur travail et tout … franchement il fait gagner du temps d’accord mais combien de temps on perd à vérifier si c’est vrai ou pas ??? ça demande 2 fois plus de travail au final …

Sauf si on veut faire un travail de M**** et là c’est autre chose.

C’est pas ChatGPT qui dérange le plus c’est les gens qui se fient à lui comme si c’était le top du savoir sans même prendre la peine de vérifier si c’est vrai ou pas.

Depuis l’avènement de l’IA, je remarque souvent dans les forums que les gens utilisent ChatGPT pour répondre aux questions des utilisateurs c’est très grave ça Les forums doivent inclure dans la charte que toute réponse issue de ChatGPT ou autre doit être mentionnée.

ça c’est SearchGPT … pour les réponses habituelles il ne reconnait jamais mais jamais qu’il est incapable de donner la réponse. bon certains vont me dire mais ça fait partie de son fonctionnement et qu’il donne les réponses qu’il juge les plus proches de son apprentissage mais non … ces outils deviennent dangereux car on les utilise dans des milieux professionnels et donc c’est la responsabilité d’OpenAI de rendre son outil plus fiable.

Binbin

Une partie de la presse n’autorise pas à OpenAI de permettre à searchGPT reprendre ses contenus et s’offusquent par la suite que ses articles ne soient pas cités comme source originale par la suite…

SlashDot2k19

Tout simplement Ils ne se posent pas la question

wedgantilles

Tout dépends de ce que tu fais. Franchement je suis pas un ultra fan de l’IA mais je vais pas mentir elle a un intérêt pour mon travail de développeur évidemment elle n’écrit pas tout mon code, mais pour réaliser certaine tache ou gagner du temps ca ne me choque pas.

Par exemple j’ai eu a porter le code d’un système qui effectue certaines actions de Javascript/Typescript vers du PHP, j’ai gagné un temps fou en demandant à ChatGPT de réaliser cela, sachant qu’il n’y avait pas de doc technique et que l’on parle de plusieurs milliers de lignes de code.

J’ai profité que l’on avait des tests qui ont aussi été porté vers PHP pour valider le code, avec évidement quelques corrections à réaliser, mais au final assez peu par rapport à l’ensemble du code, et enfin j’ai pris des données live et les ai faite tourner sur les deux versions de code pour avoir sur 2 millions de tests 1% d’erreur, après deux ou trois correction car les erreurs pouvaient avoir la même source tout était réglé.

Bilan j’ai pris 2/3 jours à réaliser le travail, alors que si j’avais du réécrire sans doc le code il m’aurait fallu beaucoup plus de temps pour comprendre et analyser le code d’origine, et ensuite tout reproduire dans l’autre langage, puis porter les tests, et probablement avoir moi même des erreurs dans ce que j’aurai fait manuellement.

Clairement il faut avoir l’esprit critique et le voir comme l’outil qu’il est, et l’utiliser pour ce pourquoi il a un intérêt, avec les contrôles qui vont bien derrière.

Alby

« Moi je m’étonne toujours comment les gens peuvent utiliser ChatGPT pour leur travail et tout … »
C’est que tu sais pas l’utiliser correctement. Il faut apprendre une science appelée « prompt engineering », savoir ce qu’il sait faire et ne pas faire.

Malheureusement beaucoup de gens demandent à Chat « comment s’appelle le père de mon chien », ils regardent la réponse et se disent : « ah, voilà, il ne sert à rien du tout cet outil » et ils vont débattre sur le fait que ce n’est pas intelligent…

MattS32

Tout dépend de l’usage qu’on en fait. Quand par exemple on lui demande simplement de faire de la rédaction, sur un sujet qu’on connait, une simple relecture suffit, le gain est donc bien là.

Idem pour certaines tâches liées au développement, les IA peuvent être assez efficaces pour trouver rapidement une explication à une erreur remontée par le compilo, pour expliquer un bout de code, pour produire certains bouts de code qui sont simples mais « longs » à écrire, et pour lesquels une simple relecture suffit à vérifier que ça marche, etc, etc… Perso clairement depuis que j’en utilise, j’ai sensiblement gagné en productivité ET en qualité de mon code (parce que je « réinvesti » une bonne part du temps gagné dans le travail sur la qualité, qui est souvent négligé pour gagner du temps…).

Mais clairement, l’utiliser comme moteur de recherche, c’est pas la meilleure des idées qui soit. Et pour cause, ce n’est pas du tout fait pour ça…

D’ailleurs en fait quand on dit qu’on fait une recherche sur Internet avec GPT, ce n’est absolument pas une réalité technique. La réalité technique, c’est que GPT intervient en amont de la recherche, pour reformuler ta recherche (et encore, pas toujours), puis il y a un autre outil qui fait la recherche, et GPT ingurgite les résultats de cette recherche pour en régurgiter une synthèse.

Drifter35

Pour la recherche assistée par IA, il existe perpexity.ai qui fait très bien le taf, qui donne des réponses sourcées et qui n’invente pas de réponse quand il n’en trouve pas.

Pernel

Chat CPT

mamide

Behh si je sais comment utiliser l’IA, d’ailleurs si tu lis mes commentaires sur les articles de Clubic parlant de l’IA, tu verras que je critique souvent la façon dont ces IA répondent.

Et j’ai dit que moi-même j’utilise des techniques pour pousser l’IA à me répondre correctement parce que souvent lui demander frontalement behhh elle donne de mauvaises réponses.

Moi j’utilise la technique de la négation, je demande le contraire de ce que je veux savoir et j’adapte mes requêtes jusqu’à arriver à ce que je veux réellement savoir. Généralement quand l’IA détecte que ce que je demande est absurde behh elle me donne la bonne réponse. bon ça marche pas tout le temps parce que parfois elle a tendance à confirmer tout ce que je dis

y a aussi la technique de comparaison, au lieu de demander la différence entre deux choses qui se ressemblent beaucoup behh j’essaie de faire une requête sur uen caractéristique de l’une des choses et ensuite je demande est-ce le cas pour l’autre chose. souvent j’obtiens de bons résultats et c’est le meilleur moyen d’arriver à ses fins. parce que dire à une IA la différence entre deux choses que les dictionnaires considèrent comme synonymes behhh c’est la galère on arrive à rien.

Est-ce que c’est assez « Prompt Engineering » pour toi ?! …

A mon avis le prompt engineering c’est pour les professionnels qui l’utilisent par exemple pour la programmation (là il faut vraiment savoir comment marche l’IA) où c’est nécessaire pour demander ce qu’on veut obtenir.

Mais sinon pour des questions qui concerne la vie courante behh je vois pas l’intérêt du prompt engineering et on devrait pas avoir recours à ça sinon qu’elle est utilite de l’IA pour le commun des mortels ?

kroman

Je préfère largement ChatGPT a Google depuis qu’il donne des extraits des sources avec les liens. Ça éviter de se taper des pages de faux sites au contenu SEO