Wikipedia doit faire face à une forte hausse de sa fréquentation… et c'est un problème !

Une loupe est dressée devant une page Wikipedia © brightstars / iStock
Une loupe est dressée devant une page Wikipedia © brightstars / iStock

L'encyclopédie en ligne Wikipédia est devenue en un peu plus de 20 ans un outil incontournable pour trouver des informations. Mais avec l'arrivée de l'intelligence artificielle, beaucoup ont pu se dire que son modèle allait finir par être obsolète, avec l'IA qui deviendrait le principal pourvoyeur d'informations. Ce qui encore à ce jour reste une vue de l'esprit. Car ce sont plutôt les IA qui ont tendance à venir piquer des données dans l'encyclopédie.

Le nombre « d'utilisateurs » augmente fortement sur Wikipedia

Ça chauffe au sein de la plus grande encyclopédie en ligne au monde. Depuis le mois de janvier 2024, Wikimedia affirme ainsi avoir enregistré une augmentation de 50% de sa bande passante, avec des téléchargements toujours plus élevés de fichiers à partir de sa plateforme. Une hausse soudaine de la popularité du média qui n'a rien d'étonnant.

En effet, ce ne sont pas les internautes humains qui ont eu tout d'un coup un appétit plus grand pour Wikipédia ou Wikimedia Commons. Selon Wikimedia, cette forte augmentation serait due aux bots des IA envoyés sur internaute pour y récolter les données si précieuses, et nécessaires à l'entraînement des modèles de langage.

© Oberon Copeland / Unsplash
© Oberon Copeland / Unsplash

Un problème pour les infrastructures de l'encyclopédie en ligne

Un vrai problème pour la pérennité de l'encyclopédie à long terme, comme elle l'indique dans sa dernière note de blog. « Notre infrastructure est conçue pour supporter des pics soudains de trafic d'origine humaine lors d'événements très intéressants, mais le volume de trafic généré par les bots de récolte est sans précédent et présente des risques et des coûts croissants » a-t-il ainsi été indiqué.

Le problème est d'autant plus important que les bots ont beaucoup plus tendance à effectuer des requêtes pour des pages peu recherchées que les humains, un type de requête « plus susceptible d'être transmis au centre de données principal, ce qui est beaucoup plus coûteux en termes de consommation de nos ressources. » En fait, 65% du trafic nécessitant le plus de ressources a pour origine ces fameux bots IA ! Un véritable casse-tête pour Wikimedia, qui travaille actuellement à des contre-mesures.

Source : Engadget

  • L'immensité du contenu proposé
  • L'accès aux fiches en mode hors ligne
  • La gratuité