Même open source, les modèles d'IA chinois les plus performants sont censurés, et cela inquiète le P.-D.G. d'HuggingFace

Par Naïm Bada, Spécialiste logiciel.

Publié le 04 décembre 2024 à 06h59

Les modèles d'intelligence artificielle chinois s'imposent comme des références incontournables dans l'écosystème open source mondial. Pourtant, leur adoption croissante soulève des inquiétudes majeures concernant la diffusion involontaire de mécanismes de censure intégrés.

La Chine monte en force sur l'IA, mais au prix d'une censure toujours bien présente. © Shutterstock

La montée en puissance des modèles d'intelligence artificielle chinois en open source soulève des inquiétudes majeures quant à la propagation mondiale de la censure. Clément Delangue, P.-D.G. d'HuggingFace, tire la sonnette d'alarme sur les implications potentielles de cette situation pour l'écosystème de l'IA.

HuggingChat

Français
Open source
Accès au Web

8 / 10

Télécharger

Une performance technique indéniable

Les modèles d'IA développés en Chine démontrent des capacités impressionnantes, notamment en matière de programmation et de raisonnement. DeepSeek s'est particulièrement illustré avec son modèle R1-Lite Preview, capable de rivaliser avec les performances du modèle o1 d'OpenAI sur des tâches mathématiques complexes. De son côté, Alibaba a créé la surprise avec QWEN 2.5 Coder 32B, offrant des performances similaires à GPT-4 tout en nécessitant moins de puissance de calcul.

La Chine a adopté une approche résolument tournée vers l'open source, permettant une diffusion rapide de ses innovations. Cette stratégie porte ses fruits : HuggingChat, la plateforme de référence mondiale, utilise désormais par défaut le modèle Qwen2.5-72B-Instruct d'Alibaba.

Le problème majeur réside dans l'intégration systématique de mécanismes de censure au sein de ces modèles. Les sujets sensibles pour le gouvernement chinois, comme les événements de la place Tian'anmen, sont systématiquement filtrés ou occultés. Cette situation résulte d'une obligation légale : les entreprises chinoises doivent s'assurer que leurs modèles « incarnent les valeurs socialistes fondamentales » et respectent le système de censure national.

Le dernier modèle de la jeune pousse chinoise Deepseek ne veut pas parler de Tian'anmen. © HuggingFace

Des préoccupations éthiques majeures

Cette situation s'inscrit dans une compétition plus large entre les États-Unis et la Chine pour la domination du secteur de l'IA. Clément Delangue prédit que la Chine pourrait prendre la tête de la course mondiale à l'IA dès 2025. Cette perspective soulève des questions cruciales sur l'influence culturelle et idéologique que pourrait exercer la Chine à travers ses modèles d'IA.

La plateforme se trouve dans une position délicate. Si certains modèles comme Qwen2.5-72B-Instruct semblent échapper à la censure, d'autres comme QwQ-32B appliquent strictement les restrictions gouvernementales chinoises. Cette disparité souligne la complexité de la situation pour les plateformes occidentales hébergeant ces modèles.

La situation des modèles chinois censurés n'est peut-être pas une impasse totale. L'exemple du modèle Dolphin-Mistral démontre qu'il est possible de modifier les jeux de données d'entraînement des modèles open source pour en retirer les biais indésirables. Cette approche de « désalignement » a notamment permis de supprimer certaines restrictions artificielles tout en préservant les performances du modèle original.

Cette piste pourrait inspirer la communauté internationale à développer des méthodes similaires pour « nettoyer » les modèles chinois de leurs mécanismes de censure, tout en conservant leurs impressionnantes capacités techniques.

Toutefois, un tel processus nécessiterait une collaboration étroite entre experts en IA et spécialistes de la culture chinoise pour garantir que cette « décensure » ne compromette pas l'intégrité culturelle des modèles existants.

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services

Source : Tech Crunch

Par Naïm Bada

Spécialiste logiciel

Intelligence artificielle

Actualités High-Tech

Comparer

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (NaN)

Poster mon commentaire

Commentaires (10)

kace9

C’est sûr que les modèles américains ne sont pas biaisés non plus, ouf, on est rassurés ; -)

johnguy_park

J’allais dire la même chose…

jeanlain

Le jour où les IA Américaines refuseront de répondre à des questions sur la guerre du Vietnam ou l’Afghanistan, ok, ça sera comparable. Sauf que c’est pas le cas.

johnguy_park

Meanwhile, les modèles américains ne sont pas un modèle de transparence non plus. Et quand certains américains proposent des modèles moins Woke et plus ouverts, ils se font traiter de danger public. Faudrait savoir ce qu’on veut.

Phi777

Le jour où il y aura une IA vraiment non censurée, idéologiquement neutre et éthique, le monde serait certainement plus juste.

Binbin

L’adoption de l’open source pour les modèles d’IA s’inscrit dans la stratégie de Pékin, accompagnée de la duplicité habituelle à notre égard. À ce jour, aucun modèle d’origine chinoise n’égale les modèles occidentaux, qui restent majoritairement développés aux États-Unis (n’en déplaise aux anti-américains primaires).

Il convient à chacun d’entre nous de faire un choix : celui de ne pas utiliser de modèles chinois pour éviter de contribuer à l’expansion de la Chine dans ce domaine stratégique.

Il convient à la presse d’éviter de relayer, même inconsciemment, la propagande chinoise visant à promouvoir l’idée erronée que la Chine est déjà leader dans l’intelligence artificielle. Cela est factuellement inexact.

Il convient de rappeler que le régime chinois ne poursuit pas des intentions bienveillantes à notre égard, mène une guerre hybride contre nos intérêts, et n’hésite pas à cibler ses opposants, même sur notre territoire, pourtant garant des libertés fondamentales.

Bit_Man

Demande à un modèle américain si les états unis sont les plus gros pourvoyeurs de guerres depuis 70 ans, il te répondra que c’est pour la Paix et qu’il n’y a aucune preuve, pareil si tu lui demandes de développer l’idée du petro dollar.
Mais, on converse pas forcement avec les modèles d’IA pour savoir si des étudiants ont été écrasés par des tanks ou si d’autres ordures ont inventé des preuves qui n’existent pas, c’est une censure qui concerne sans doute moins de 1 millionième des sujets, demandes et discussions que l’on peut avoir avec une IA.

Binbin

Il convient de rappeler que les États-Unis d’Amérique, sont une démocratie, contrairement à la Chine.

MattS32

Non :

Bombing_Basta

Que n’avez-vous pas saisi dans le caractère open-source d’un logiciel ?
Un mécanisme de censure intégré dans un logiciel open-source peut être désintégré…

Mieux vaut un logiciel open-source censuré ou un logiciel closed-source dont on ne sait absolument rien des rouages et de ce qu’il censure ou non ?

Vous avez quatre heures.