Ces CAPTCHA sous la forme de puzzle vous prennent du temps ? Google gagne de l'argent © lilgrapher / Shutterstock
Ces CAPTCHA sous la forme de puzzle vous prennent du temps ? Google gagne de l'argent © lilgrapher / Shutterstock

Une étude de l'université de Californie à Irvine révèle que les utilisateurs ont consacré 819 millions d'heures non rémunérées à résoudre des CAPTCHA depuis 2009. Ces tests censés bloquer les robots s'avèrent peu efficaces face à l'IA moderne, tout en permettant à Google de récolter des données lucratives.

Les CAPTCHA, ces petits puzzles agaçants qu'on nous impose sur le Web, ne sont plus vraiment un rempart contre les robots. En revanche, ils restent une mine d'or pour Google, qui devait les supprimer de son paysage fin 2023. C'est ce que dévoile une récente étude menée par des chercheurs de l'université de Californie. Pendant des années, on nous a vendu ces tests comme indispensables à notre sécurité en ligne. La réalité est bien différente.

Non seulement leur efficacité laisse à désirer face aux progrès de l'intelligence artificielle, malgré les efforts déployés pour les rendre plus complexes à résoudre, mais en plus, ils transforment chacun de nos clics en données monnayables. Le géant du Web aurait ainsi engrangé des milliards grâce à notre travail gratuit, tout en nous faisant perdre un temps fou.

Les CAPTCHA, boucliers anti-robots ou passoires ?

Le principe des CAPTCHA semblait simple et ingénieux à l'origine. L'idée était de créer un test rapide qu'un humain pouvait facilement réussir, mais pas un ordinateur. Cela permettait de bloquer les robots malveillants tentant d'accéder massivement à certains sites ou services en ligne.

Google a racheté le système reCAPTCHA en 2009 et l'a depuis largement déployé sur le Web. Au fil des années, les tests ont évolué. On est passé de la saisie de textes déformés à des puzzles d'images, puis à une simple case à cocher. La dernière version fonctionne même de façon invisible, en analysant le comportement de l'utilisateur.

Le hic, c'est que ces systèmes censés nous protéger sont de plus en plus facilement contournés par l'IA. Dès 2016, des chercheurs parvenaient à tromper 70 % des CAPTCHA fondés sur des images. La version avec case à cocher serait même battue dans 100 % des cas par certains robots. Ironiquement, les progrès en intelligence artificielle que les CAPTCHA ont aidé à réaliser les rendent aujourd'hui obsolètes.

Malgré tout, ces tests restent omniprésents sur le Web. Près de 3 millions de sites utilisent encore la version 2 de reCAPTCHA, pourtant largement dépassée, à l'instar de cette petite expérience à base de collier et de mamie. Et cette situation profite surtout à Google.

819 millions d'heures à résoudre des puzzle et des millions de dollars de salaires perdus dans la poche de Google

L'étude menée par l'université de Californie à Irvine lève le voile sur les dessous peu reluisants du système reCAPTCHA. Les chercheurs ont analysé plus de 9 000 sessions réelles et interrogé une centaine d'utilisateurs. Leurs conclusions sont sans appel. En 13 ans, les internautes auraient passé collectivement 819 millions d'heures à résoudre ces puzzles. Cela représente l'équivalent de 6,1 milliards de dollars en salaires si ce travail avait été rémunéré. Un temps précieux gaspillé pour une sécurité illusoire.

Car l'objectif réel de Google serait ailleurs. Chaque test résolu permet d'entraîner ses algorithmes de reconnaissance d'image ou de collecter des données comportementales. Des informations que l'entreprise peut ensuite revendre à prix d'or. Les chercheurs estiment que Google aurait ainsi engrangé entre 8,75 et 32,3 milliards de dollars.

Aujourd'hui, même les bots pourraient prouver qu'ils n'en sont pas © ninefotostudio / Shutterstock

Le système génère aussi un trafic colossal : 134 pétaoctets de bande passante consommés, soit l'équivalent de 7,5 millions de kWh d'énergie. Un bilan carbone non négligeable pour un bénéfice de sécurité quasi nul.

L'étude pointe du doigt l'hypocrisie de Google. L'entreprise continue de promouvoir reCAPTCHA comme un outil de sécurité, alors qu'elle sait pertinemment que son efficacité est compromise depuis des années. Cette stratégie lui permet de maintenir sa collecte massive de données sous couvert de protection des utilisateurs. Comme l'indiquent nos confrères de The Register, à l'heure où nous écrivons ces lignes, Google n'a pas réagi à cette étude.

Source : The Register