Une étude d'Harvard alerte sur les dangers de la publication d'articles scientifiques "douteux" sur Google Scholar

Certains contenus scientifiques ou techniques dans Google Scholar peuvent avoir été générés par IA et ne pas être fiables - © Iryna Imago / Shutterstock

Des chercheurs d'Harvard préviennent que Google Scholar, le moteur de recherche académique, référence de nombreux articles scientifiques générés par intelligence artificielle.

Si vous ne connaissez pas Google Scholar, c'est soit que la science n'est pas votre tasse de thé, soit que lorsque vous étiez étudiants, Google n'était même pas à l'état d'embryon. Dans les deux cas, vous avez échappé à cette étude de l'université d'Harvard qui révèle que l'outil de référence pour la recherche académique regorge d'articles scientifiques douteux générés par intelligence artificielle.

Eh oui, encore elle. La facilité avec laquelle ces articles « falsifiés » peuvent être trouvés sur la plateforme est alarmante, selon les chercheurs. Contrairement aux bases de données académiques traditionnelles, Google Scholar indexe un large éventail de contenus sans appliquer de critères stricts de sélection ou de révision par les pairs.

Google Scholar : la porte ouverte aux articles générés par IA ?

Google Scholar n'est pas un site de publication de contenus techniques, mais se contente d'indexer un maximum de publications scientifiques pour les rendre accessibles au plus grand nombre. Un outil formidable en théorie, mais qui présente un défaut de taille : son manque de filtrage.

Contrairement aux bases de données académiques traditionnelles, Google Scholar n'applique pas de critères stricts pour l'inclusion des articles. Il suffit qu'un texte ait l'apparence d'une publication scientifique pour être référencé. Cette politique de la porte ouverte a une conséquence inattendue : elle permet à des articles générés par IA de se glisser dans les résultats de recherche.

L'étude d'Harvard met l'accent sur l'ampleur du phénomène. Sur un échantillon d'articles contenant des phrases typiques des textes générés par IA, plus de 60 % s'avéraient des publications douteuses. Ces articles se retrouvent côte à côte avec des recherches légitimes, sans aucune distinction visible pour l'utilisateur lambda.

Un exemple de résultats de recherche sur Google Scholar - Capture d'écran © Mélina Loupia / Clubic

Un problème aux multiples facettes

Toujours d'après les universitaires d'Harvard, la prolifération d'articles générés par IA sur Google Scholar n'est pas qu'une simple anecdote. C'est un véritable casse-tête qui menace l'intégrité de la recherche scientifique.

Premier problème : la qualité de l'information. Les articles générés par IA peuvent contenir des erreurs, des biais ou des conclusions hâtives. Ils n'ont pas passé le filtre de l'évaluation par les pairs, pierre angulaire de la méthode scientifique. Résultat ? Des informations potentiellement fausses ou trompeuses se retrouvent au même niveau que des recherches rigoureuses.

Deuxième souci : l'impact sur la confiance du public. Si n'importe qui peut générer un article scientifique en quelques clics, que reste-t-il de la crédibilité de la recherche ? Cette situation pourrait alimenter le scepticisme envers la science, déjà mis à mal par les théories du complot et la désinformation.

A découvrir

Quels sont les meilleurs détecteurs de contenu écrit par intelligence artificielle ? Comparatif 2025

Enfin, il y a le risque de manipulation. Des groupes d'intérêts pourraient utiliser cette faille pour inonder Google Scholar d'articles favorables à leur cause, créant artificiellement un consensus scientifique là où il n'y en a pas.

Les chercheurs de Harvard proposent plusieurs recommandations pour lutter contre les articles falsifiés générés par IA sur Google Scholar. D'abord, renforcer les mécanismes de vérification et de validation des contenus indexés par la plateforme. Ensuite, sensibiliser la communauté académique à ce problème, tout comme le développement d'outils de détection automatique des contenus générés par IA. Ils encouragent également Google à instaurer des filtres plus stricts et à collaborer avec des experts pour améliorer la qualité des résultats. Enfin, ils pensent que promouvoir l'éducation aux médias et à l'information scientifique aidera les utilisateurs à évaluer la fiabilité des sources.

Google Scholar

La simplicité d'utilisation.
La possibilité de créer un profil et sa bibliothèque.
Gratuit.

9 / 10

Télécharger

Source : Harvard Kennedy School