Niantic s'appuie sur le taux colossal de données amassées par les joueurs de Pokémon GO pour mettre au point un « grand modèle géospatial » (LGM). Objectif : « permettre aux ordinateurs non seulement de percevoir et de comprendre les espaces physiques, mais aussi d'interagir avec eux d'une manière nouvelle ».
Les personnes qui ont joué à Pokémon GO ne s'attendaient certainement pas à une telle nouvelle. Le modèle est ainsi fondé sur le Visual Positioning System de Niantic, conçu à partir des scans des utilisateurs d'applications de la firme, comme Pokémon GO et Ingress.
« Ces données sont uniques, parce qu'elles sont prises du point de vue des piétons et qu'elles incluent des endroits inaccessibles aux voitures », explique l'éditeur.
Comprendre l'espace comme les humains
Mais le Visual Positioning System est encore limité. « Si un modèle local n'a vu que l'entrée d'une église, il sera incapable de reconnaître son arrière », illustre la société. Contrairement aux modèles 3D classiques, le modèle géospatial, lui, apprend à partir de milliards d'images géolocalisées pour développer une compréhension spatiale globale.
Niantic l'apparente à un grand modèle de langage axé sur la 3D et l'espace. Il peut non seulement reconnaître un lieu depuis un angle donné, mais aussi prédire son apparence depuis d'autres points de vue en s'appuyant sur sa compréhension accumulée de structures similaires à travers le monde.
De cette manière, il « peut extrapoler des caractéristiques communes et prédire, par exemple, la structure arrière d'une église, même si elle n'a jamais été directement capturée ». Cette « compréhension globale » détient un potentiel immense, l'objectif étant de permettre aux machines de comprendre l'espace de la même manière que les humains.
De nombreux usages
L'IA pourrait alimenter toute une génération de nouvelles technologies, estime l'entreprise, en commençant par les lunettes de réalité augmentée, où elle permettrait un placement précis et persistant d'objets virtuels dans l'environnement réel.
Au-delà du gaming, les applications sont vastes : des systèmes de navigation enrichis permettant une orientation intuitive dans des environnements complexes, des outils de planification urbaine et d'aménagement du territoire, des solutions logistiques avancées et des plateformes de collaboration à distance plus immersives.
L'intégration à des robots pour leur permettre de naviguer et d'interagir avec l'espace est également envisagée par la société. À ce jour, Niantic a formé « plus de 50 millions de réseaux neuronaux ». « Tous ces réseaux combinés comprennent plus de 150 billions de paramètres optimisés à l'aide de l'apprentissage automatique », étaye-t-elle.
1 million de nouveaux scans chaque semaine
Dans son long billet de blog, qui se concentre davantage sur l'aspect technique de la technologie, Niantic reste très discrète quant à la protection des données issues des scans des utilisateurs.
Selon ses dires, elle dispose tout de même « de 10 millions de sites scannés dans le monde entier » et reçoit « environ 1 million de nouveaux scans chaque semaine, chacun contenant des centaines d'images ».
18 octobre 2024 à 17h55