PIGEON : cette inquiétante IA peut localiser une photo rien qu'en analysant son arrière-plan

Publié le 28 décembre 2023 à 18h31

PIEGON l'IA à l'oeil d'aigle © Ryan adi / Shutterstock

PIGEON est une IA développé à Stanford et, même si son nom peut prêter à sourire pour les francophones, ses capacités de décryptage d'images sont stupéfiantes.

On savait déjà que certains systèmes d'IA disposaient déjà de compétences redoutables en matière de reconnaissance faciale, comme PimEyes ou encore Clearview AI. Cette fois-ci, une équipe d'étudiants de Stanford ont repoussé les limites de cette technologie avec PIEGON. C'est un modèle d'IA capable de localiser avec une extrême précision l'endroit où a été capturée une photo en analysant simplement son arrière-plan.

Une précision impressionnante

PIGEON n'a pas grand chose à voir avec le volatile bien connu de tous, mais signifie en réalité Predicting Images Geolocations. Ce programme peut donc passer au crible les photos fournies par Google Street View et déterminer instantanément d'où vient le cliché. Sa précision est de l'ordre de 92 % lorsqu'il s'agit de localiser le pays représenté sur l'image. Encore plus impressionnant : dans plus de 40 % des cas, PIGEON peut reconnaître un endroit à moins de 25 km de sa position réelle.

Pour se rendre compte de la performance, il est possible de mettre en parallèle ses performances avec celles d'humains sur le jeu GeoGuessr. Dans ce dernier, les joueurs doivent deviner l'emplacement d'une photo aléatoire issue de la base de données de Street View. Une immense communauté est très active autour de ce jeu et un système de classement existe pour que les utilisateurs mesurent leurs performances entre eux. Eh bien PIGEON est très bon à ce petit exercice, puisqu'il se classe dans le top 0,01 % des meilleurs joueurs. Il a réussi à battre l'un des meilleurs joueurs pro au monde, Trevor Rainbolt en jouant six matchs contre lui.

GeoGuessr, un jeu de niche fortement apprécié © friesfly / Reddit

Fonctionnement et implications éthiques

Pour que PIGEON atteigne ce niveau de performance, il a été entraîné grâce à un réseau neuronal développé par OpenAI nommé CLIP, qui permet de relier images et textes. Les étudiants se sont inspirés de GeoGuessr pour affiner leur modèle. Ils l'ont nourri à l'aide d'un dataset comportant 100 000 emplacements photographiés aléatoires en associant chacun de ceux-ci à quatre images différentes. Au total, PIGEON a donc été entraîné avec 400 000 images.

Parallèlement à cela, un modèle connexe a également été développé (PIGEOTTO) et entraîné grâce à 4 millions de photographies, pour la plupart issues de Wikipédia et de Flickr. Cela lui a permis de pouvoir s'exercer à identifier un lieu à partir d'une seule image. Toutefois, les créateurs de PIGEON sont bien conscients des implications éthiques inhérentes au développement d'un modèle aussi puissant. Principalement au niveau du respect de la vie privée. Ainsi, les paramètres du modèles ne sont pas disponibles au public et leur code n'est disponible qu'à des fins de vérification académique.

PIGEON est une prouesse autant saisissante qu'inquiétante. D'un point de vue technologique pur, l'avancée est incontestable. D'un point de vue éthique, nous sommes en droit de nous questionner sur les impacts possibles d'une telle technologie si elle sortait du champ académique : surveillance d'individus sans leur consentement, exploitation commerciale, divulgation de données de localisations sensibles (militaires, agents de renseignement) ou utilisation dans un cadre politique autoritariste. Les scénarios sombres ne manquent pas. Pourvu que PIGEON reste bien tranquillement dans sa volière.

Source : ZDNet

Par Camille Coirault

La tech est mon terrain de jeu, la science ma maîtresse capricieuse et le jeu vidéo (malgré mes overdoses récurrentes de AAA) mon péché mignon. Voici votre serviteur, explorant la jungle technologique armé d'un simple PC et salivant comme un bouledogue devant la moindre innovation. Transformer le jargon technique en prose savoureuse, traquer les news ultimes avec les neurones toujours à balle de caféine : voilà ma mission.

Articles de Camille Coirault

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Rejoignez la communauté Clubic

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

Commentaires (10)

kroman

J’ai donné une photo à ChatGPT pour rechercher le lieu de la prise de vue. Il l’a trouvé à moins de 100 m !

chicour

Avec les exif ?

Martin_Penwald

Chiche. Où est-ce ?

Comcom1

Et bah entre l’article merdique sur un robot fou et celui-ci décidément la qualité ça baisse !
Le sensationnel plutôt que l’objectivité la mode médiatique à son comble

Papy65

Expliqué comme cela, ça ne veut rien dire qui permette de juger l’efficacité de ChatGPT pour cette utilisation. Certains endroits sont tellement photographiés que même nous arrivons à les reconnaître sans jamais y avoir été. Google Lens y arrivait déjà depuis un bon bout de temps

Proutie66

A la montagne. Je pense qu’il y fait froid.
Si je peux aider…

Kriz4liD

J adore geoguessr ! Allez s y c’est un excellent jeu . Et a 20€ l année c’est pas cher payé

Nmut

Pas d’accord.
Autant l’article des robots est pas terrible (racoleur et sans infos), autant ici c’est pas trop mal, on a les données de base, le fonctionnement et le résultat, avec en « bonus » les implications possibles. On a toutes les infos pour savoir si on a envie / besoin de creuser le sujet. Ca ressemble plus à du travail journalistique que l’article sur le robot de l’usine Tesla qui est juste une traduction d’un tabloïd moisi.

youmetooandyou

Ce qui va tuer l’AI, chatGPT et consors : les droits d’auteur

Wuinny

@martin6: Groenland vu le manque de lumière. On alors c’est juste très mal exposé