© Wachiwit / Shutterstock
© Wachiwit / Shutterstock

Après de nombreux mois de controverse concernant la collecte de données pour entraîner les IA génératives, OpenAI ouvre la voie pour changer la donne.

L'avenir avec l'intelligence artificielle s'annonce-t-il soudainement un peu plus serein ?

Un petit fichier texte à modifier

La base de données de ChatGPT est un peu datée, puisqu'elle est limitée à 2021. C'est un problème pour son développeur, OpenAI, qui doit faire face à une concurrence croissante, notamment à celle de Google Bard, qui a un accès beaucoup plus direct à l'ensemble du Web, et donc potentiellement à ses connaissances. Pour pallier cette carence, un certain GPTBot vient de faire son apparition. Tout comme les robots des moteurs de recherche qui parcourent le Web pour référencer les pages des sites internet, il a la capacité de se balader de page en page, d'en aspirer les données et de les transmettre à ChatGPT.

Une vision d'horreur, dites-vous ? Pas tout à fait, car OpenAI a pensé à tout. En effet, les administrateurs de sites web peuvent dès à présent empêcher GPTBot d'explorer leur contenu en bloquant leur adresse IP, ou bien en modifiant un fichier qu'ils connaissent déjà très bien : robots.txt. Ce dernier agit comme un videur devant un site, autorisant ou non le passage aux robots de Google ou de Bing, pour ne citer qu'eux. Celui de ChatGPT ne fait donc pas exception, et il s'agit d'une très bonne nouvelle, qui pourrait marquer le début de changements majeurs pour le secteur dans la meilleure des directions.

© Rock'n Roll Monkey / Unsplash
© Rock'n Roll Monkey / Unsplash

Un précédent significatif pour tout un secteur ?

Entre les grèves de scénaristes, les plaintes d'artistes et le besoin immédiat de créer de nouvelles réglementations, les programmes tels que ChatGPT ou Midjourney ont provoqué un sacré remue-ménage, c'est le moins que l'on puisse dire. Ayant besoin de collecter de nombreuses connaissances pour se former, ils se sont naturellement tournés vers Internet pour en obtenir le plus possible. Cependant, la protection des données personnelles des internautes et de la propriété intellectuelle des créateurs et autres organisations est rapidement devenue un point sensible, au point de provoquer de nombreuses levées de boucliers.

Les intelligences artificielles ont le potentiel d'apporter énormément de changements dans nos habitudes, en bien ou en mal. Cependant, leur utilisation soulève des questions que nos sociétés n'ont pas encore réussi à aborder pleinement et sur lesquelles il n'existe pas de consensus. Les IA génératives développées par les géants de la tech vont donc devoir s'adapter un peu, sous peine de recevoir un énorme retour de bâton qui pourrait bien ralentir leur développement plus qu'autre chose.

C'est pourquoi le secteur travaille main dans la main avec les institutions gouvernementales pour s'adapter sereinement à nos sociétés. En témoigne un accord signé avec la Maison-Blanche par plusieurs entreprises d'IA, dans le but de développer un système permettant de savoir si quelque chose a été généré par l'intelligence artificielle ou non. Et si tout le monde ne promet pas de cesser d'utiliser les données des utilisateurs pour développer ses produits, il se pourrait que de nombreux détracteurs de ChatGPT et compagnie trouvent l'approche d'OpenAI inspirante. Cependant, cette dernière ne se retient pas de préciser que « permettre à GPTBot d'accéder à votre site peut aider les modèles d'IA à devenir plus précis et à améliorer leurs capacités générales et leur sécurité ».

  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code
10 / 10

Source : The Verge