L'IA du géant NVIDIA est en train de révolutionner l'apprentissage des robots, en leur permettant d'apprendre et d'accomplir des tâches complexes, presque comme des tours de magie. L'homme et la robotique n'ont jamais été aussi proches.
Eurêka, tel est le nom du nouvel agent d'intelligence artificielle créé par les équipes de NVIDIA Research. L'IA utilise les grands modèles de langage (LLM) de l'entreprise pour générer automatiquement des algorithmes de récompense, qui aident à former les robots à accomplir des tâches complexes, comme faire tourner rapidement un stylo. Voir l'IA enseigner des compétences aux robots, voilà qui est aussi bluffant que prometteur.
Avec son nouvel agent d'IA, NVIDIA révolutionne l'apprentissage robotique
Le nouvel agent d'IA, développé par NVIDIA, a atteint un jalon époustouflant dans le domaine de l'apprentissage des robots. Eurêka, directement alimenté par le puissant modèle de langage GPT-4, a enseigné à une main robotique à effectuer des tours de stylo rapides, avec une précision comparable à celle d'un être humain.
Imaginez, chers lecteurs, que cette prouesse n'est que l'une des quelque 30 tâches que les robots ont pu maîtriser grâce à Eurêka, qui rédige de manière autonome des algorithmes de récompense pour les former.
Eurêka révolutionne ici l'apprentissage par renforcement, en apprenant aux robots à effectuer des tâches complexes, par exemple ouvrir des tiroirs et armoires, lancer et rattraper une balle, mais aussi manipuler des ciseaux. Et tout cela, sans nécessiter de modèles de récompense prédéfinis, une avancée majeure.
Une amélioration des performances du robot de plus de 50 %
Anima Anandkumar, directrice principale de la recherche sur l'IA du côté de NVIDIA, souligne que « l'apprentissage par renforcement a permis des victoires impressionnantes au cours de la dernière décennie, mais de nombreux défis subsistent, tels que la conception des récompenses, qui reste un processus d'essais et d'erreurs ».
Eurêka est capable de résoudre ces défis en surpassant les programmes de récompense écrits par des experts, dans plus de 80 % des tâches. On constate alors une amélioration moyenne des performances de plus de 50 % pour les robots.
Ce qui se cache derrière Eurêka
Eurêka exploite, nous le disions, la puissance de l'IA générative et du modèle de langage GPT-4 d'OpenAI, notamment pour écrire des algorithmes. Derrière, la simulation accélérée par GPU dans Isaac Gym (l'environnement de simulation physique de NVIDIA, plateforme de simulation robotique haute performance de bout en bout), permet à Eurêka d'évaluer rapidement un grand nombre de candidats à la récompense, ce qui aide à optimiser l'efficacité de l'entraînement.
Une fois les résultats de la formation générés, l'agent demande à GPT-4 d'améliorer sa génération de fonctions de récompense, contribuant à l'amélioration continue de l'IA elle-même ! Eurêka est d'ailleurs déjà capable d'enseigner à toute une variété de robots : des bipèdes, des mains robotiques habiles, des quadrupèdes ou encore des bras de cobot.
Dans le document de recherche d'Eurêka, on découvre des évaluations détaillées de 20 tâches formées par l'IA, qui démontre à chaque fois la capacité des robots à accomplir une gamme variée de compétences de manipulation complexes. En combinant les grands modèles de langage et les technologies de simulation accélérées par GPU de NVIDIA, Eurêka ouvre la porte à la création de nouvelles animations physiques réalistes pour les artistes.
Dans le genre, NVIDIA exploite déjà Voyager, un agent d'IA capable de jouer de manière autonome à Minecraft. Et le potentiel est immense : vision par ordinateur, voitures autonomes, infographie et robotique, les grands acteurs technologiques redéfinissent la façon dont les robots apprennent et interagissent avec le monde qui les entoure. Eurêka est la dernière réalisation de cette recherche novatrice.
Source : Eureka-Research (NVIDIA)