Comment comprendre précisément le contenu d'une image ? Voilà une question à laquelle Microsoft Research souhaite répondre grâce à plusieurs algorithmes. Sur How-Old.net, Microsoft tente de détecter l'âge d'une personne grâce à une simple photo. Sur TwinsOrNot.net, l'idée est de calculer le pourcentage de ressemblance entre deux individus. Avec le Project Oxford, les chercheurs souhaitent enfin identifier les émotions d'un sujet directement à partir d'un cliché.
Cette fois, Microsoft annonce avoir travaillé avec les chercheurs de l'université de Carnegie Mellon pour concevoir un système de vision artificielle capable d'analyser les images et de répondre naturellement à des questions. Selon Microsoft cette technologie pourrait permettre « d'effectuer des recommandations et des actions en temps réel pour anticiper les besoins humains ».
Concrètement, pour les chercheurs de Microsoft, l'idée est de comprendre instantanément les différents éléments d'une situation en analysant une image en temps réel tout en étant capable de comprendre le langage naturel. Ainsi, un cycliste muni d'un casque embarquant une caméra serait en mesure de formuler une question du type : « Qu'y a-t-il derrière moi à gauche ? » ou « y a-t-il des coureurs proches de moi que je n'aurais pas vu ? ». De son côté, l'algorithme est capable de répondre par une recommandation.
Pour ce faire, l'algorithme a été conçu afin d'éliminer rapidement les éléments jugés les moins pertinents pour traiter une question afin de se concentrer sur la zone principale. « Avec ce système, l'image passe au travers d'un système de neurones artificiels pour décider quelles zones sont pertinentes », affirme ainsi, le chercheur Xiaodong He. Le processus est donc semblable au fonctionnement du cerveau humain.
D'autres sociétés s'intéressent à la vision artificielle. C'est le cas de Yahoo! qui a apposé un dispositif sur sa plate-forme Flickr mais également de Google sur son service de photos dévoilé au printemps dernier.
- Consultez l'étude dans son intégralité sur cette page (PDF)
A lire également :