Les modèles d'intelligence artificielle chinois s'imposent comme des références incontournables dans l'écosystème open source mondial. Pourtant, leur adoption croissante soulève des inquiétudes majeures concernant la diffusion involontaire de mécanismes de censure intégrés.
La montée en puissance des modèles d'intelligence artificielle chinois en open source soulève des inquiétudes majeures quant à la propagation mondiale de la censure. Clément Delangue, P.-D.G. d'HuggingFace, tire la sonnette d'alarme sur les implications potentielles de cette situation pour l'écosystème de l'IA.
- Français
- Open source
- Accès au Web
Une performance technique indéniable
Les modèles d'IA développés en Chine démontrent des capacités impressionnantes, notamment en matière de programmation et de raisonnement. DeepSeek s'est particulièrement illustré avec son modèle R1-Lite Preview, capable de rivaliser avec les performances du modèle o1 d'OpenAI sur des tâches mathématiques complexes. De son côté, Alibaba a créé la surprise avec QWEN 2.5 Coder 32B, offrant des performances similaires à GPT-4 tout en nécessitant moins de puissance de calcul.
La Chine a adopté une approche résolument tournée vers l'open source, permettant une diffusion rapide de ses innovations. Cette stratégie porte ses fruits : HuggingChat, la plateforme de référence mondiale, utilise désormais par défaut le modèle Qwen2.5-72B-Instruct d'Alibaba.
Le problème majeur réside dans l'intégration systématique de mécanismes de censure au sein de ces modèles. Les sujets sensibles pour le gouvernement chinois, comme les événements de la place Tian'anmen, sont systématiquement filtrés ou occultés. Cette situation résulte d'une obligation légale : les entreprises chinoises doivent s'assurer que leurs modèles « incarnent les valeurs socialistes fondamentales » et respectent le système de censure national.
Des préoccupations éthiques majeures
Cette situation s'inscrit dans une compétition plus large entre les États-Unis et la Chine pour la domination du secteur de l'IA. Clément Delangue prédit que la Chine pourrait prendre la tête de la course mondiale à l'IA dès 2025. Cette perspective soulève des questions cruciales sur l'influence culturelle et idéologique que pourrait exercer la Chine à travers ses modèles d'IA.
La plateforme se trouve dans une position délicate. Si certains modèles comme Qwen2.5-72B-Instruct semblent échapper à la censure, d'autres comme QwQ-32B appliquent strictement les restrictions gouvernementales chinoises. Cette disparité souligne la complexité de la situation pour les plateformes occidentales hébergeant ces modèles.
La situation des modèles chinois censurés n'est peut-être pas une impasse totale. L'exemple du modèle Dolphin-Mistral démontre qu'il est possible de modifier les jeux de données d'entraînement des modèles open source pour en retirer les biais indésirables. Cette approche de « désalignement » a notamment permis de supprimer certaines restrictions artificielles tout en préservant les performances du modèle original.
Cette piste pourrait inspirer la communauté internationale à développer des méthodes similaires pour « nettoyer » les modèles chinois de leurs mécanismes de censure, tout en conservant leurs impressionnantes capacités techniques.
Toutefois, un tel processus nécessiterait une collaboration étroite entre experts en IA et spécialistes de la culture chinoise pour garantir que cette « décensure » ne compromette pas l'intégrité culturelle des modèles existants.
25 novembre 2024 à 11h36
Source : Tech Crunch