Le géant américain aurait utilisé des œuvres françaises pour alimenter ses modèles de langage. Résultat, Meta va devoir se justifier devant la justice hexagonale.

Meta doit faire face à une accusation d'utilisation illégale de données pour alimenter ses IA © Skorzewiak / Shutterstock
Meta doit faire face à une accusation d'utilisation illégale de données pour alimenter ses IA © Skorzewiak / Shutterstock

Dans le domaine de l'intelligence artificielle, les données sont cruciales, afin d'entraîner les différentes IA. Alors, toutes les entreprises du secteur sont insatiables, même celles comme Meta, qui a pourtant accès à un nombre de données assez exceptionnel grâce à ses réseaux sociaux. Et le groupe de Mark Zuckerberg est d'ailleurs allé beaucoup plus loin, au point piocher dans de nombreux livres français. Illégalement, à en croire les acteurs du secteur.

Les spécialistes du livre accusent Meta de ne pas avoir respecté le droit d'auteur

Meta est l'objet d'une nouvelle plainte, cette fois en France, de la part des organisations représentatives du livre. Le Syndicat national des auteurs et des compositeurs (SNAC), la Société des gens de lettres (SGDL) et le Syndicat national de l’édition (SNE) ont ainsi saisi le tribunal judiciaire de Paris.

« Nous avons constaté la présence de nombreuses œuvres éditées par des membres du Syndicat national de l'édition dans les corpus de données utilisés par Meta » a-t-il été indiqué dans un communiqué. L'objectif des plaignants est de réussir à « imposer le respect du droit d'auteur aux développeurs d'outils d'intelligence artificielle générative. »

La base de données Books3 en cause

Dans le détail, les représentants des éditeurs reprochent à Meta d'avoir utilisé jusqu'en 2023 la base de données Books3, constituée illégalement, et regroupant quelque 200 000 livres, pour entraîner son modèle de langage Llama. Cette base de données intègre pour une partie des livres français.

Cette utilisation avait été reconnue par Meta dès 2024, à l'occasion d'une procédure judiciaire. Le groupe américain avait alors indiqué respecter le concept de « fair use », ou « usage raisonnable », qui, dans le droit américain, permet d'imposer certaines limites aux droits d'auteur, qui est alors balancé avec d'autres intérêts.

Pas de quoi arrêter les syndicats d'éditeurs. « L'action que nous entamons doit aussi faire naître une volonté sérieuse des IA de tenir compte de la création, d'en respecter le cadre juridique et le cas échéant de trouver des contreparties pour l'utilisation d'œuvres dont ils se nourrissent » a indiqué le président de la SGDL, Christophe Hardy, au Parisien.

Source : Le Parisien

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025
À découvrir
Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services