Le robot de Google DeepMind qui a reçu de nouvelles capacités grâce à Gemini © Google DeepMind
Le robot de Google DeepMind qui a reçu de nouvelles capacités grâce à Gemini © Google DeepMind

Google DeepMind a intégré son intelligence artificielle Gemini à ses robots pour optimiser leurs performances. Et les premiers résultats obtenus par les chercheurs sont plutôt encourageants !

La révolution de l'IA générative initiée par ChatGPT va avoir des répercussions sur un nombre colossal de secteurs. Mais il y en a un qui est pour le moment moins évoqué, c'est celui de la robotique. Pourtant, ce type de modèles a le potentiel de décupler les capacités des robots, comme en témoignent les premiers tests opérés par Google DeepMind.

Améliorer la compréhension du robot

Dans une nouvelle étude, les équipes détaillent les résultats de leur expérience après avoir incorporé la variante 1.5 du grand modèle de langage (LLM) Gemini à leur androïde. Concrètement, le modèle est en mesure d'étendre le contexte de la machine, lui permettant de cartographier des zones importantes et de s'y rendre si cela lui est demandé.

Pour former le robot, les chercheurs ont réalisé une visite guidée de leurs locaux en lui indiquant des zones et des objets spécifiques à retenir. Ensuite, le robot a analysé des séquences vidéo de ces explorations, facilitant ainsi l'élaboration d'une cartographie cognitive détaillée et la compréhension des relations spatiales complexes au sein de l'environnement. Grâce à Gemini, l'androïde a été capable de mémoriser de nombreux éléments, comme l'emplacement des bureaux temporaires, des prises de courant, etc.

En conséquence, il a pu effectuer les diverses tâches qui lui ont été demandées. Le robot a opéré plus de 50 instructions différentes lors des tests, avec un taux de réussite de 90 %, assure Google DeepMind.

Gemini a été lancé en février 2024 © Shutterstock
Gemini a été lancé en février 2024 © Shutterstock

Une filière d'avenir

À l'avenir, le robot pourrait devenir encore plus précis. Une personne travaillant dans un bureau où il y a beaucoup de canettes de Coca vides pourrait, par exemple, demander au robot si sa boisson préférée est disponible dans la cuisine. Il serait alors en mesure d'aller chercher ladite boisson et de la reconnaître, sans que son nom ait été mentionné.

Des défis attendent encore les chercheurs. Entre 10 et 30 secondes sont nécessaires pour que l'appareil traite les instructions, expliquent-ils. Malgré tout, cette avancée démontre le potentiel de l'IA générative dans la robotique. D'ailleurs, Google est loin d'être le seul géant technologique intéressé par ces nouvelles possibilités.

Au début de l'année, la start-up Figure AI, qui développe des humanoïdes, a levé 500 millions de dollars dans un tour de table conduit par Microsoft, OpenAI et NVIDIA. Équipé de ChatGPT, son robot peut converser et interagir avec les humains.

  • Un modèle de génération puissant
  • Une base de connaissances actualisée en temps réel
  • Gratuit et intégré à l'écosystème Google
8 / 10

Sources : The Verge, arXiv