Les assistants IA déforment-ils l'actualité ? Le rapport alarmant de la BBC

Par Mathieu Grumiaux, Expert maison connectée.

Publié le 13 février 2025 à 14h01

La BBC a mené une enquête en testant les principaux services d'intelligence artificielle sur ses propres articles. Le résultat est sans appel : vérifiez bien les informations délivrées par l'IA, qui commet encore de très grosses erreurs.

Attention aux résumés d'actu par IA : ils comportent de très grosses erreurs © Tero Vesalainen / Shutterstock.com

L'intelligence artificielle est définitivement entrée dans le quotidien de nombreux internautes, et notamment pour résumer des pages web, et plus précisément des articles de presse. L'IA générative peut, en quelques secondes, condenser une ou plusieurs sources d'actualité en quelques lignes qui permettent d'obtenir les points les plus importants d'un article de presse. L'IA est-elle seulement infaillible ? La BBC s'est livrée à une expérience pour évaluer sa pertinence, et les résultats sont bien plus contrastés que ne nous les vendent les plus grands acteurs du secteur.

ChatGPT, Gemini et Perplexity à l'épreuve du fact-checking

La BBC a mis à l'épreuve quatre technologies d'intelligence artificielle, à savoir ChatGPT d'OpenAI, Copilot de Microsoft, Google Gemini et enfin Perplexity. Pour ce faire, la BBC a autorisé temporairement différentes technologies d'intelligence à utiliser ses propres articles et ses archives, en entrainant l'IA à utiliser autant que possible ses contenus d'actualité pour répondre aux demandes.

Les journalistes à l'origine de cette étude ont ensuite posé 100 questions d'actualité à chaque agent d'intelligence artificielle, en lui demandant de résumer l'information en la contextualisant. Pour chaque réponse donnée, ils ont enfin procédé à une évaluation de la pertinence de l'information résumée selon sept critères, à savoir la précision, l'attribution des sources, l'impartialité, la distinction entre opinion et fait, l'éditorialisation, le contexte et la représentation fidèle du contenu produit par la BBC.

Les résultats sont loin d'être satisfaisants. Selon les données de l'étude, 51% des réponses contenaient des erreurs significatives. Plus inquiétant encore, 19% des réponses citant la BBC comportaient des erreurs factuelles et 13% des citations étaient modifiées ou inexistantes dans les sources citées.

Aucun chatbot n'est infaillible, la prudence est donc de mise ! © Tada Images / Shutterstock

Tous les chatbots font des erreurs, mais Gemini plus que les autres

Sur les quatre technologies d'intelligence artificielle testées, Perplexity est le meilleur élève de groupe sur presque tous les critères évalués, même si le service pose quelques problèmes en matière d'éditorialisation et des approximations lorsqu'il s'agit d'ajouter les citations des personnes interrogées dans les articles. Microsoft Copilot quant à lui utilise des sources datées, avec des informations qui ne sont plus d'actualité aujourd'hui pouvant conduire à des erreurs d'interprétation. ChatGPT n'est pas en reste, avec des erreurs de dates et quelques biais éditoriaux dans certaines réponses.

Gemini de Google récolte quant à lui le bonnet d'âne, avec le plus d'erreurs ou d'approximations générées lors de la génération d'un résumé d'actualité. A titre d'exemple, la BBC indique que Gemini affirme que le NHS (l'institution de santé publique au Royaume-Uni) déconseille la cigarette électronique lors d'un sevrage tabacologique, ce qui est faux puisque au contraire cette dernière la recommande parmi tous les dispositifs à utiliser lors d'un arrêt du tabac. Près de 34% des réponses de Google Gemini comportaient des erreurs importantes et la BBC donne d'autres exemples éloquents.

La BBC ne se contente pas d'un simple constat, mais livre également des pistes de réflexion pour améliorer la pertinence de l'IA dans le traitement de l'actualité. La vénérable institution invite les grands groupes technologiques à se rapprocher des éditeurs pour améliorer la qualité des réponses générées. Elle invite également les autorités à offrir un cadre de régulation à l'IA pour garantir la fiabilité des informations diffusées via ces outils.

En attendant que des dispositions soient mises en œuvre, nous ne pouvons que vous inviter à vérifier par deux fois les informations données par une intelligence artificielle et à ne pas prendre ces résumés pour argent comptant. Consultez les sources mentionnées, et donnez la priorité au travail des journalistes qui délivrent une information de qualité et contextualisée. Nous ne vous conseillons pas de bannir l'intelligence artificielle de votre quotidien, qui reste très pratique pour gagner du temps, mais seulement de faire attention à ce qu'elle raconte.

Source : BBC

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services

Par Mathieu Grumiaux

Expert maison connectée

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (8)

kplan

Comme on dit entre collègues, avant de poser une question à une IA, mieux vaut avoir une bonne idée de la réponse.

charcotp

C’est le risque principal que je vois : utiliser l’IA pour avoir une réponse définitive sur un sujet que l’on maitrise mal. Par contre, pour des sujets correctement maitrisé, l’IA a pu m’apporter des sources originales (et fiables, pas du francesoir) qui ont complété mes infos.

zaxxonV

si le sujet est maîtrisé quel intérêt de demander ce que tu sais déjà ?
Par rapport à la complétion d’info : dans la même logique comment peux-tu être sûr que les infos complémentaires sont justes et non des hallucinations ?

crazywolf

Est-ce que des stats équivalentes sont faites sur les informations diffusées par les journalistes ?

kplan

L’IA est souvent utilisée comme assistant dans ton domaine professionnel. Tu peux plus facilement connaître le sérieux des réponses et en contrôler les sources que lorsque tu ne connais rien à un domaine.
En l’utilisant pour affiner une programmation, un script ou demander une solution à un problème que tu rencontres dans ton code, tu peux analyser facilement la réponse et c’est vraiment utile.
Quand tu veux t’informer, il faudra toujours faire comme avant, contrôler les sources et ne pas laisser l’IA t’imposer sa vision et son analyse.

Je ne fais jamais 100% confiance à un inconnu déclarant maitriser un sujet auquel je ne connais rien. C’est pareil pour l’IA.

jvachez

C’est en bonne partie à cause des droits d’auteur. Les IA sont obligées de tout reformuler pour ne pas être attaquées, ce qui cause de genre d’effets négatifs.

Nmut

Peut être en partie.
Mais c’est surtout un problème intrinsèque aux IA, et surtout aux LLM. Attendu qu’aucune info n’est réellement stockée, la restitution se base sur une probabilité avec un grain d’aléatoire. Ca donne un résultat qui semble impeccable sur la forme mais qui est très imparfait sur le fond.
Par analogie, on pourrait rapprocher les réponses des LLM à des intuitions, des impressions, des associations d’idées et du « bon sens » (souvent un ensemble de préjugés) sans contexte ni logique sous-jacente. C’est super utile en recherche ou quand on cherche une idée pour avancer sur un problème et que l’on est capable de valider les choses produites, mais sinon, ça me semble bien risqué!

charcotp

L’IA me permet de faire rédiger un texte clair, parfois un peu simple, rapidement, sur un sujet que je maitrise. Sur un sujet dont je ne maitrise pas tous les tenants et aboutissants, pour peu que le sujet soit controversé, tu te retrouves à une mise à égalité de toutes les théories. En poussant à l’extrême, avec la baisse de qualité des sources, tu vas avoir à un moment le modèle héliocentrique considéré comme controversé.