ChatGPT s'est vite imposé comme une source d'information très populaire, mais sa capacité à générer des textes peut être exploitée à des fins de triche, de fraude, voire d'actes malveillants. Si vous avez un doute sur l'origine d'un texte, il est possible de détecter si celui-ci a été écrit par un humain ou par l'agent conversationnel ChatGPT.
Collégiens, lycéens et étudiants, traducteurs, rédacteurs web… Pour eux, la tentation est grande de gagner du temps sur leurs projets en ayant recours à ChatGPT, capable de produire rapidement des contenus (plus ou moins fiables) si on lui donne les bonnes instructions. Sachez qu'il existe des techniques pour repérer si un texte a été écrit avec l'aide de la plateforme ou à la main.
Comment savoir si un texte a été rédigé par ChatGPT ?
1. Utiliser le classificateur d'OpenAI
À la suite de critiques visant certains usages de ChatGPT, OpenAI a décidé de développer un outil baptisé « AI Text Classifier » à qui l'on peut soumettre un texte pour découvrir s'il a été écrit par un humain ou généré par une intelligence artificielle.
Il n'est pas encore totalement fiable, et OpenAI avertit les utilisateurs qu'il peut se tromper, surtout sur les textes qui ne sont pas écrits en anglais, qui sont écrits par des enfants ou qui sont trop courts (1 000 caractères minimum sont requis pour soumettre à l'analyse). La firme précise également qu'il est facile pour un humain de modifier légèrement un texte rédigé par ChatGPT pour tromper le classificateur.
Lors de notre test, l'outil n'a pas été en mesure de nous répondre pour un texte rédigé par un humain : « Le classificateur considère qu'il n'est pas clair si le texte a été généré par IA », nous a-t-il fait savoir. Il a toutefois identifié avec succès un texte généré par ChatGPT.
2. Soumettre le texte à GPTZero
Développé par Edward Tian, un étudiant en informatique américain, GPTZero propose également de vérifier si un texte provient de l'écriture d'un humain ou d'une intelligence artificielle. Paradoxalement, cette solution est plus riche en fonctions que le classificateur officiel d'OpenAI.
Déjà, il permet d'importer un fichier en format .pdf, .docx ou .txt au lieu de devoir impérativement coller le texte dans un champ. À la fin de l'analyse, GPTZero octroie un score de complexité ainsi qu'un score mesurant l'évolution de la complexité au fil du texte, les variations étant un signe important d'un texte généré, au moins en partie, par IA.
L'outil souligne en jaune les phrases qui lui paraissent écrites par un algorithme. Il indique aussi très clairement la probabilité qu'un texte soit produit par un humain ou une IA, et s'il s'agit du texte entier ou seulement d'un extrait de celui-ci qui est concerné.
Le service est fondé sur le modèle GPT-2, une version antérieure à celui utilisé par ChatGPT (qui repose sur le modèle GPT-3), exploitée par exemple par le jeu AI Dungeon. Dans notre cas, GPTZero a identifié avec succès l'origine du premier texte que nous lui avons soumis (écrit par un humain), bien qu'il soit en français. Pour le second texte, généré par ChatGPT, il s'est trompé en estimant qu'il avait été entièrement écrit à la main, mais lui a octroyé à juste titre un faible score de complexité.
- Un service en ligne, accessible facilement
- Des statistiques développées pour savoir si les textes viennent de GPT
- Une API pour automatiser ou utiliser plusieurs fois l'outil
3. Le détecteur de contenu IA par Copyleaks
Encore en bêta, cet outil reste basique et ne prend en charge que le copier-coller de texte. Une fois ce dernier analysé, il affiche un pourcentage de probabilité qu'une IA ait été utilisée ou qu'il s'agisse d'un texte rédigé par un humain. Le texte soupçonné d'être généré par IA apparaît en rouge pour le différencier de celui censé provenir d'un humain.
Malheureusement, la fiabilité de l'outil est à revoir. Il a estimé que le texte qui nous lui avons soumis est d'origine humaine à 99,9 %, alors qu'il a été créé par ChatGPT. Pourtant, Copyleaks prétend que son service est nativement compatible avec le français. Il a en revanche bien identifié notre article écrit par un rédacteur comme tel.
4. L'alternative OpenAI Detector
Plus à l'aise sur les textes en anglais et fondé sur un modèle de détection GPT-2, OpenAI Detector a échoué comme ses concurrents à analyser notre texte sorti de ChatGPT comme provenant d'une IA, estimant à 99,8 % qu'il était l'œuvre d'un humain. Il a néanmoins bien reconnu que notre texte rédigé à la main était d'origine humaine.
Il existe de nombreux outils de détection de l'intelligence artificielle pour des textes, mais ils ont pour la plupart bien du mal à détecter un texte généré par une IA. Seul le classificateur d'OpenAI, qui a aussi créé ChatGPT, a reconnu que le texte soumis provenait d'une intelligence artificielle. Il s'est toutefois montré moins efficace pour déterminer l'origine de notre texte écrit par un humain.
- Chat dans différentes langues, dont le français
- Générer, traduire et obtenir un résumé de texte
- Générer, optimiser et corriger du code