Le géant américain aurait utilisé des œuvres françaises pour alimenter ses modèles de langage. Résultat, Meta va devoir se justifier devant la justice hexagonale.

Dans le domaine de l'intelligence artificielle, les données sont cruciales, afin d'entraîner les différentes IA. Alors, toutes les entreprises du secteur sont insatiables, même celles comme Meta, qui a pourtant accès à un nombre de données assez exceptionnel grâce à ses réseaux sociaux. Et le groupe de Mark Zuckerberg est d'ailleurs allé beaucoup plus loin, au point piocher dans de nombreux livres français. Illégalement, à en croire les acteurs du secteur.
Les spécialistes du livre accusent Meta de ne pas avoir respecté le droit d'auteur
Meta est l'objet d'une nouvelle plainte, cette fois en France, de la part des organisations représentatives du livre. Le Syndicat national des auteurs et des compositeurs (SNAC), la Société des gens de lettres (SGDL) et le Syndicat national de l’édition (SNE) ont ainsi saisi le tribunal judiciaire de Paris.
« Nous avons constaté la présence de nombreuses œuvres éditées par des membres du Syndicat national de l'édition dans les corpus de données utilisés par Meta » a-t-il été indiqué dans un communiqué. L'objectif des plaignants est de réussir à « imposer le respect du droit d'auteur aux développeurs d'outils d'intelligence artificielle générative. »
La base de données Books3 en cause
Dans le détail, les représentants des éditeurs reprochent à Meta d'avoir utilisé jusqu'en 2023 la base de données Books3, constituée illégalement, et regroupant quelque 200 000 livres, pour entraîner son modèle de langage Llama. Cette base de données intègre pour une partie des livres français.
Cette utilisation avait été reconnue par Meta dès 2024, à l'occasion d'une procédure judiciaire. Le groupe américain avait alors indiqué respecter le concept de « fair use », ou « usage raisonnable », qui, dans le droit américain, permet d'imposer certaines limites aux droits d'auteur, qui est alors balancé avec d'autres intérêts.
Pas de quoi arrêter les syndicats d'éditeurs. « L'action que nous entamons doit aussi faire naître une volonté sérieuse des IA de tenir compte de la création, d'en respecter le cadre juridique et le cas échéant de trouver des contreparties pour l'utilisation d'œuvres dont ils se nourrissent » a indiqué le président de la SGDL, Christophe Hardy, au Parisien.
Source : Le Parisien
04 février 2025 à 14h11