Alors qu’OpenAI facture 200 dollars par mois pour son outil d’analyse automatisée, Hugging Face mobilise sa communauté pour développer une alternative open source. Un projet ambitieux qui suscite déjà l’enthousiasme des développeurs.
Le Deep Research d’OpenAI, présenté dimanche dernier, permet de générer des rapports détaillés sur n’importe quel sujet en analysant le web en temps réel. Problème : cette fonctionnalité reste réservée aux abonnés payants de ChatGPT Pro, à 200 dollars mensuels. Face à ce modèle fermé, les chercheurs de Hugging Face ont lancé en moins de 24 heures Open Deep Research, un framework open source combinant le modèle o1 d’OpenAI et des outils libres de navigation web.
Une course contre la montre technologique
Le Deep Research d’OpenAI, présenté dimanche dernier, permet de générer des rapports détaillés sur n’importe quel sujet en analysant le web en temps réel. Problème : cette fonctionnalité reste réservée aux abonnés payants de ChatGPT Pro, à 200 dollars mensuels. Face à ce modèle fermé, les chercheurs de Hugging Face ont lancé en moins de 24 heures Open Deep Research, un framework open source combinant le modèle o1 d’OpenAI et des outils libres de navigation web.
« Notre objectif est de rendre accessible une technologie équivalente sans barrière financière », explique Thomas Wolf, cofondateur de Hugging Face. Le système utilise un navigateur textuel pour explorer des pages, manipuler des fichiers et effectuer des calculs, avec un score de 54 % au benchmark GAIA contre 67,36 % pour la solution d’OpenAI.
L’approche de Hugging Face repose sur deux piliers : un modèle d’IA propriétaire (o1, Sonnet 3.5, GPT-4o, etc… accessible via API payante) et une couche logicielle ouverte. Cette architecture hybride permet d’obtenir des performances supérieures aux modèles entièrement libres comme DeepSeek-R1 lorsqu'il est hébergé localement, tout en gardant une transparence sur les mécanismes d’analyse.
Les premiers tests révèlent cependant des limites. La démo publique, victime de son succès, a connu des dysfonctionnements lors de son lancement. « Nous travaillons à stabiliser l’infrastructure », précise l’équipe, qui a publié le code source sur GitHub pour accélérer les améliorations collaboratives.
Le défi de la transparence
Si le projet marque une avancée, il se heurte à un obstacle de taille : l’absence d’équivalent open source au modèle o3 d’OpenAI, véritable moteur du Deep Research original. Hugging Face mise sur sa communauté pour combler cet écart. Plus de 10 000 contributeurs ont déjà rejoint l’initiative, mobilisant 768 GPU NVIDIA H100 via le Science Cluster de la plateforme. « La maîtrise des données et des processus est essentielle pour déployer une IA responsable », insiste Elie Bakouch, ingénieur du projet.
Cette initiative s’inscrit dans un mouvement plus large de contestation des modèles économiques fermés. DeepSeek, avec son modèle R1 développé pour moins de 6 millions de dollars, a déjà montré qu’une approche ouverte pouvait concurrencer les géants du secteur.
Reste à voir si Open Deep Research parviendra à maintenir son rythme de développement face aux ressources colossales d’OpenAI. Les prochaines semaines seront déterminantes pour évaluer sa capacité à reproduire les fonctionnalités premium tout en gardant son ADN communautaire.
Une version bêta fonctionnelle est attendue d’ici fin février 2025, selon les responsables du projet. Les entreprises intéressées peuvent d’ores et déjà expérimenter avec le code source sur GitHub, malgré les actuelles limitations techniques.
Source : Hugging Face