Quand l'IA peut lire, elle en oublie qu'elle peut voir : CLIP se fait avoir par une étiquette

Publié le 15 mars 2021 à 08h39

Pour déjouer une IA, inutile d’aller chercher bien loin ; parfois, un stylo et un bout de papier suffisent. Démonstration avec CLIP, un réseau neuronal artificiel pourtant très performant, qu’une simple note manuscrite suffit à berner.

En début d’année, l’entreprise spécialisée en intelligence artificielle OpenAI présentait le réseau neuronal CLIP (Contrastrive Language-Image Pre-Training). Sa particularité : il est capable d’apprendre de manière autonome sur Internet en faisant directement le lien entre une image le texte qui l’accompagne. C’est là sa principale force et ce qui le distingue d’outils d'apprentissage supervisés, qui nécessitent un entrainement à la fois fastidieux et couteux, et se bornent à quelques catégories prédéfinies.

Ceci est un iPod

Un membre d'OpenAi explique : « La base données ImageNet, l'un des plus grands efforts dans ce domaine, a nécessité plus de 25 000 travailleurs pour annoter 14 millions d'images pour 22 000 catégories d'objets. En revanche, CLIP apprend à partir de paires texte-image qui sont déjà accessibles au public sur Internet ».

Toutefois, ce système a des limites. Si CLIP n’a aucune difficulté à distinguer une banane ou une orange parmi un océan de fruits, apposer une simple note manuscrite sur l’un d’eux suffit à le dérouter : en inscrivant iPod sur un bout de papier, l’IA prendra une pomme pour ce qu’elle n’est pas. Et non, ce n’est, a priori, pas une blague de sa part, en référence au logo de la société.

Prendre un caniche pour une tirelire

Dans un registre similaire, affubler la photographie d’un caniche de symboles dollars sème également la zizanie dans l’esprit de CLIP ; il confond alors l’animal avec une tirelire.

« Le neurone « finance » [1330], par exemple, répond aux images de tirelires, mais aussi à la chaîne "$$$". En forçant ce neurone à s’activer, nous pouvons tromper notre modèle et l'amener à classer un chien en tant que tirelire ».

Un subterfuge qualifié « d’attaque typographique »

Les chercheurs d’OpenAI qualifient cette duperie « d’attaque typographique » ; et selon eux, ce type d’attaque est « loin d’être une simple préoccupation académique ».

« En exploitant la capacité du système à lire du texte, nous constatons que même les photographies contenant du texte manuscrit peuvent le tromper. À l’instar de l’Adversarial Patch, cette attaque fonctionne en pratique ; mais elle ne nécessite pas plus de moyens qu'un stylo et du papier […]. Nous pensons également que ces attaques peuvent prendre une forme plus subtile et moins visible ».

L'école Internet, pas forcément la plus vertueuse….

Qu’une IA confonde une pomme et un iPod n’est pas dramatique. Cependant, l’article soulève un autre risque, plus sérieux, au sujet de certaines classifications effectuées par CLIP. En faisant son apprentissage directement sur Internet plutôt que sur une base de données spécifiquement conçue pour elle, l'IA adopte en effet certains préjugés.

Les chercheurs d’OpenAI rapportent qu’ils ont ainsi découvert « de nombreuses associations anodines », mais également « plusieurs cas où CLIP retient des associations qui pourraient entraîner un préjudice, comme le dénigrement de certains individus ou groupes ».

« Nous avons observé, par exemple, un neurone "Moyen-Orient" [1895] associé au terrorisme, et un neurone "immigration" [395] qui réagit à l'Amérique latine. Nous avons même trouvé un neurone qui se déclenche à la fois pour les personnes à la peau foncée et pour les gorilles [1257], ce qui reflète des cas antérieurs de marquage de photos que nous considérons comme inacceptable ».

Ils estiment que même en affinant le système, « il est probable que ces biais et associations restent en place », et que « leurs effets se manifestent à la fois de manière visible et presque invisible […] ».

Un fait peu rassurant dans un monde où les technologies basées sur l’IA deviennent de plus en plus utilisées et plébiscitées…

Sources : Vice.com, OpenAI

Par Rémi Bouvet

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

jedi1973

Et apres on appel ca encore une IA ??? Ce en sont en fait que des algorithmes d’apprentissage ( algorithme qui se base sur une base de données des reponses a donner…)un peu plus avancé. Elle sera vraiment une IA quand elle saura que quelque chose cloche…

jedi1973

Le racisme n’existe pas… pour preciser , je parle bien du racisme propre a l’homme qu’il a decidé… En effet, dire que vivre ensemble etait bien et dire que rester chacun chez soit est raciste !!! A ce compte la, tout le monde de vivant sur terre est raciste alors, des animaux, aux vegetaux … As tu vu deja des fourmis rouge cohabiter avec des fourmis noirs ? des lions dans le meme clans que des hienes, du blé au milieu d’une foret ? des abeilles dans le meme nids que des oiseaux, etc… la nature a fait tout etre vivant « raciste » cad qui prefere vivre a coté de ses semblables… L’homme n’est pas different. il se mefie naturellement de ceux qui vivent pas comme lui… Qui se ressemble s’assemble… Dire le contraire et traiter tout le monde de raciste est contre nature… C’est pour ca, pour en revenir a notre affaire que l’IA est consideré comme raciste ( alors que l4IA est neurte de toute consideration ethnique ou politique puisque consideré comme un robot), car parle cruement sans religion et sans contrainte humaine… C’est comme si lancer des dés a jouer et a un moment donné, donnait plus de chiffres pair qu’impaire… Les impaires diraient que le dés est raciste a leur encontre… C’est pour ca que je dis, le racisme n’existe pas… C’est juste une protection personnelle. ( comme construire un mur en Chine, donc les chinois sont racistes aussi envers les Mongols ???)

kyrios

@jedi1973 Le racisme signifie qu’on considère que certaines races sont supérieures à d’autres. Déjà c’est une idéologie débile parce que chaque race a évolue pour s’adapter à son milieu et en plus chaque individu est différent. Rien à voir avec le vivre ensemble.

Blap

Bravo, tu viens de découvrir ce qu’est l’IA.

@Vimaire Sauf que l’IA est basé sur la représentation humaine, ca ne part pas de zéro, c’est pourtant marqué dans l’article. Tout comme le bot Tay sur Twitter qui est devenu horrible au bout de seulement quelques heures.

carinae

Non pas forcément le racisme c’est aussi et surtout porter préjudice d’une manière ou d’une autre a un groupe d’individus en fonction de certains critères…

carinae

Le problème n’est pas nouveau. Si je me souviens bien il y a quelques années c’était un algorithme de Google (je crois) qui s’était planté car il ne classifiait pas correctement les photos notamment a cause de la couleur de peau. Ce n’était pas vraiment l’algorithme le problème mais plutôt le modèle d’entraînement.
Bref, en fonction de l’apprentissage, l’interprétation peut donner des résultats non attendus…la preuve comme l’homme quoi

fg03

« Ceci n’est pas une pipe »
…mais un ipod

jcc137

Moi aussi, je n’ai jamais compris pourquoi on mettait autant d’intérêt à appeler, ce qui est en somme un simple programme informatique, une IA ??? Un litanie dans le code source de IF, DO et THEN qui lorsqu’un élément n’est pas prévu dans l’exécution, buggue comme au bon vieux temps de Windows 3.0

tfpsly

Marketing, journalistes ne comprenant pas que « recherche en IA » ne veut pas dire que « c’est de l’IA », puis ça se propage…
Il n’y a toujours aucune vraie IA à l’heure actuelle.

tangofever

Une I.A trompée, une I.A 1.0 !