Automattic, la société derrière WordPress et Tumblr, serait à son tour sur le point de vendre le contenu créé par ses utilisateurs à des laboratoires d'IA. Une telle pratique n'est pas vraiment une première, et pourrait même se généraliser chez les entreprises de la tech en mal de revenus.
C'est une source interne dans l'entreprise qui a renseigné 404 media : la maison mère de WordPress et Tumblr serait sur le point de signer des accords avec OpenAI et Midjourney, leur donnant accès à de nombreuses données utilisateurs ainsi que le contenu créé par ces derniers pour entraîner des IA. L'accord n'est pas encore officiel, mais l'étendue des données partagées interroge déjà, malgré les tentatives d'Automattic de rassurer ses utilisateurs.
Puisqu'il y a des lois, les laboratoires d'IA acceptent désormais de payer
Il n'y a pas si longtemps encore, OpenAI, Google, ou encore Midjourney n'auraient jamais sorti leur chéquier pour se servir dans tout ce qu'internet compte de données et autres contenus créés par d'autres, sans jamais que leurs détenteurs ou les sites qui les hébergent n'aient la possibilité de s'y opposer, Google allant jusqu'à revendiquer la totalité de l'internet libre. Mais la prise de conscience des législateurs, d'une part, ainsi que des sites qui hébergent ces contenus, de l'autre, ont quelque peu changé cela.
L'utilisation libre des contenus utilisateurs pour entraîner des intelligences artificielles est notamment l'un des arguments qui fut utilisé pour justifier les décisions de X.com, puis de Reddit, de rendre payant l'accès à leurs API, provoquant à chaque fois un tollé. Reddit, d'ailleurs, n'a pas perdu beaucoup plus de temps et a par la suite signé un accord avec Google lui permettant d'utiliser les contenus présents sur son site, moyennant 60 millions de dollars. L'entreprise, qui n'a jamais été profitable au cours de son histoire, a peut-être ainsi trouvé un moyen de se rendre attractive auprès d'investisseurs. Une phrase qui colle également parfaitement à Tumblr.
Automattic tente de rassurer ses utilisateurs
L'accord lui-même n'a pas encore été rendu public, et le montant payé par OpenAI et Midjourney encore moins, mais Automattic tente déjà de rassurer les utilisateurs de ses services par le biais d'un article de blog. Après une introduction générique assurant qu'elle ne travaillait qu'avec les entreprises d'intelligence artificielle qui respectaient ses valeurs, la maison mère de WordPress et Tumblr assure qu'il sera possible à ses utilisateurs le souhaitant de se retirer de l'accord pour que leurs données et contenus ne soient pas utilisés. Le post de blog précise cependant qu'à l'exception de l'Union européenne, aucune loi ne contraint les entreprises à respecter de telles décisions de retrait…
Par ailleurs, la nature des données partagées avec les sociétés d'IA n'est pas entièrement connue. Un document interne à l'entreprise semble suggérer qu'Automattic avait initialement été un peu trop enthousiaste : les données incluses dans l'accord incluaient ainsi des posts publiés sur des blogs privés, des blogs supprimés ou suspendus, des réponses privées, ou encore le contenu de certains blogs premium. Il faudra un peu plus de travail à Automattic pour rassurer sur la nature innocente de l'accord.
Source : 404 media, Automattic