Have I Been Trained est un nouvel outil qui permet aux artistes de savoir si certaines images protégées ont été utilisées dans le cadre de l'entraînement des intelligences artificielles.
Cet outil en ligne qui s'appuie sur deux grandes bases de données était très attendu à l'heure où les plaintes pour atteinte aux droits d'auteur se multiplient.
L'entraînement des IA, un problème pour les artistes
Régulièrement, lorsque d'importantes vagues de piratage de données ont lieu, les internautes se redirigent vers l'outil Have I Been Pwned pour savoir si la confidentialité de leurs coordonnées a été compromise ou non. Aujourd'hui, ce sont les artistes qui doivent faire face à ce problème. Avec l'explosion de la popularité des IA de création d'images telles que Stable Diffusion ou Midjourney, il devient difficile de savoir avec quelles images elles ont été entraînées.
C'est là une difficulté supplémentaire pour les créateurs de contenu, qui ont bien du mal à savoir si leurs œuvres ont été utilisées ou non, et dans quelle mesure cela concerne les droits d'auteur. En effet, les IA actuelles ne créent pas à partir de rien et sont entraînées avec de gigantesques bases de données disponibles sur le Web.
Les artistes peuvent désormais se tourner vers Have I Been Trained, qui fonctionne sur le même principe que Have I Been Pwned. L'outil, déjà très populaire, consulte deux grandes bases de données nommées LAION 5B et LAION 400M, et qui contiennent 5 milliards et 400 millions d'images. Les artistes peuvent ainsi savoir ce qu'il en est et éventuellement demander le retrait des œuvres utilisées.
Pour qui a été conçu Have I Been Trained ?
Tout d'abord, il convient de préciser que les gestionnaires de Have I Been Trained travaillent en étroite collaboration avec LAION. Ces bases de données décrivent textuellement un énorme volume d'images, ce qui permet aux IA de réaliser des associations de plus en plus pertinentes. Concrètement, les utilisateurs de l'outil peuvent lui demander de faire une recherche par texte ou par image, après quoi ils pourront observer les résultats et lancer des démarches si c'est nécessaire.
« Nous sommes en partenariat avec LAION, qui a assemblé ces bases de données afin de faire en sorte que les futurs modèles [d’IA] ne soient pas entraînés avec des œuvres qui ont été retirées », explique la plateforme.
Have I Been Trained, s'il peut être utilisé par tout un chacun, est avant tout réservé aux artistes, en réponse à plusieurs polémiques et plaintes déposées. Getty Images et plusieurs artistes se sont déjà retournés contre Stable Diffusion et Midjourney qui auraient illégalement utilisé un grand nombre d'images protégées. Bien évidemment, cela ne réglera pas tous les problèmes liés à l'utilisation des IA, mais Have I Been Trained semble en mesure de faire gagner un temps précieux aux artistes.
Sources : Have I Been Trained, ABC News