Le jour où j’ai découvert l’Objective-Driven AI, l’intelligence artificielle de demain

Par Nicolas Guyot, Rédacteur en chef.

Publié le 20 avril 2024 à 08h38

Yann LeCun est le chantre de l'intelligence artificielle chez Meta. ©️ Nicolas Guyot / Clubic

Oubliez l’IA générative, ce n’est pas moi qui le dis, mais Yann LeCun, le gourou tricolore de l’intelligence artificielle. Sur le long chemin vers l’IA générale, le scientifique en chef et vice-président de Meta mise sur un modèle basé sur l’objectif, capable d’apprendre, de raisonner et de planifier en toute sécurité. Tout un programme.

IA par ci, IA par là. L’intelligence artificielle fait les choux gras des médias et des réseaux sociaux, Clubic le premier. Alors, quand Meta m'a proposé de me rendre dans ses locaux pour parler d’intelligence artificielle avec ses experts maison, je n'ai pas hésité deux secondes. Yann LeCun, Joëlle Pineau, Naila Murray… Le casting était alléchant, tout comme la promesse d’y voir plus clair dans ce maelstrom d’innovations et de technologies.

ChatGPT, la surprise qu'il n'a pas vue venir

Lorsque Yann LeCun, Vice President et Chief AI Scientist de Meta prend la parole, ça devient tout de suite passionnant et instructif. Prix Turing 2018 et membre l’Académie nationale des sciences aux États-Unis, nous nous apercevons instantanément que notre interlocuteur n’a pas vraiment sa langue dans sa poche : « ChatGPT ? Une surprise, un engouement populaire que nous n’avons pas su anticiper alors que ce n’était pas le modèle d’IA générative le plus avancé de l’époque ». Intérieurement, je tique un peu en me souvenant du bad buzz provoqué à l'époque par la mise en ligne de Galactica, le modèle de langage de Meta aussitôt retiré de la circulation fin 2022.

L'IA générative, c'est nul ! © Nicolas Guyot / Clubic

Alors qu’Elon Musk prévoit l’émergence d’une IA plus intelligente que l’être humain dès l’année prochaine, Yann LeCun dénote là aussi dans le concert ambiant en expliquant que le niveau des IA génératives actuelles est bien trop limité : « elles ne peuvent pas réfléchir par elle-même, elles commettent des erreurs basiques, elles hallucinent... ».

Celles-ci devraient se cantonner à l’aide à l’écriture, à l’édition ou, encore, à assister les développeurs dans le codage de leurs programmes informatiques. Pour lui, bien que LLaMA soit aussi un une IA générative développée par Meta (la version 3 a été officiellement annoncée cette semaine), il y aurait beaucoup mieux à faire en attendant d’atteindre le niveau d’une IA générale qui, au passage, ne serait pas près d’arriver. 10 ans ? 15 ans ? On ne sait pas ! L’homme aux Ray-Ban connectées préférant d’ailleurs parler d’AMI, l’acronyme d’Advanced Machine Intelligence.

S'inspirer des humains ou des animaux pour l'apprentissage

L’un des points fondamentaux à améliorer serait le machine learning ou l'apprentissage automatique en français. L’idée serait de s’inspirer un peu plus des humains, voire même des animaux, qui apprennent des tâches beaucoup plus rapidement que n’importe quelle machine existante, qui comprennent en un clin d’œil le monde les entourant et qui peuvent élaborer rapidement un plan. C’est ce sens commun, ce comportement basé sur les objectifs qu’il faudrait copier. « Même un chat est capable de planifier des tâches complexes » rappelle Yann LeCun, justifiant le travail encore à accomplir. Voilà des propos qui flattent littéralement mon ego de propriétaire de chat.

On apprend plus vite en regardant des vidéos. © Nicolas Guyot / Clubic

Toujours dans la démonstration, le Monsieur IA de Meta rappelle qu’un enfant de 10 ans est capable de débarrasser une table et de remplir un lave-vaisselle tout seul, ce qu’aucun robot n’a jamais réussi à faire à ce jour. Idem pour les voitures autonomes de niveau 5 qui ne sont toujours pas déployées à grande échelle alors qu’un ado de 17 ans peut passer son permis après 20 heures de cours en auto-école.

A découvrir

Meta dévoile Llama 3 et Meta AI, "l’assistant IA gratuit le plus intelligent du marché", intégré à ses réseaux sociaux

19 avril 2024 à 11h21

News

Le machine learning des IA génératives n'est pas au niveau

Et si on veut pousser un peu plus loin la comparaison des capacités d’apprentissage d’un modèle d’IA générative face à un enfant de 4 ans, là aussi, il n'y a pas match. Yann Lecun nous apprend en effet que les deux millions de nerfs optiques d’un gamin - soit une bande passante par nerf estimée à 10 octets/sec - sont capables d’ingérer 50 fois plus de données en vidéo qu’une LLM (large language model, modèle d'IA générative) avec du texte sur le même temps d'apprentissage.

Une IA générative apprend en recomposant un texte auquel des mots ont été retirés, mais ça ne fonctionne pas avec les images et vidéos. © Nicolas Guyot / Clubic

Le constat de Yann LeCun est lapidaire : le machine learning de ces modèles est « nul ». Pour repousser le niveau de l’IA générative qui, en 10 années de recherche, n’a jamais réussi à apprendre efficacement avec des objets comme des images et vidéos, il faudrait revoir l’approche et privilégier l’apprentissage par l’objectif.

Comprendre le monde, pour mieux raisonner et planifier

C’est la piste choisie par Yann LeCun avec son modèle d’IA axé sur les objectifs (Objective-Driven AI Architecture). Un modèle qui ne chercherait pas à reconstruire ce qui manque dans un texte ou une vidéo, mais qui pourrait construire une représentation abstraite de la réalité et faire la prédiction de ce qui se passe dans le contenu soumis. L’objectif étant de mettre au point un système capable de comprendre le monde, d’avoir un certain sens commun et de planifier des séquences d’action pour arriver à un but particulier.

V-JEPA est un modèle d'IA prédictive entraîné pour comprendre le contenu d'une vidéo. © Nicolas Guyot / Clubic

Un système capable d’apprendre, par exemple, la physique de notre monde grâce à des vidéos et qui arriverait à la conclusion que « les feuilles d’un arbre qui s’agitent ou le reflet de la lumière sur la surface d’un lac ne sont pas des informations pertinentes à prédire ou à traiter ». Le parfait assistant IA en somme, capable de répondre à toutes nos questions, de mémoriser, de nous aider dans notre quotidien et de comprendre nos préférences et intérêts. Un premier modèle est déjà sorti des laboratoires de Meta, dénommé JEPA pour Joint Embedding Predictive Architecture.

Un long processus évolutif vers l'IA générale

Open source tout comme LLaMA, l’IA générative de Meta, JEPA en est à sa deuxième version et permettrait déjà de prédire les images manquantes d’une vidéo à l’aide de l’apprentissage auto-supervisé (V-JEPA), mais aussi de reconnaître le contenu d’une image (I-JEPA) ou, encore, de mesurer la hauteur de la canopée des forêts grâce à des images satellites.

Pour Yann LeCun, ce n'est pas avec une IA générative qu'on pourra planifier un voyage New York - Paris. © Nicolas Guyot / Clubic

De là à pronostiquer l’arrivée prochaine d’une intelligence artificielle générale ? Ce ne serait pas vraiment pour tout de suite d'après Yann LeCun. L’IA basée sur l’objectif ne serait qu’une étape dans l’évolution de l’intelligence artificielle. Un processus évolutif jalonné de nouveaux modèles « toujours plus intelligents » jusqu’à atteindre, un jour ou l’autre, l'Everest de l’IA. Une course où de nouveaux acteurs aux dents longues comme OpenAI et Mistral n’auront pas peur de bousculer l’ordre établi et de repousser toujours plus les limites de la science. En attendant, mon chat resterait plus intelligent que ChatGPT...

A découvrir

Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025

30 décembre 2024 à 11h18

Comparatifs services

Par Nicolas Guyot

Rédacteur en chef

Référencement logiciel

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

nicgrover

« Lorsque Yann LeCun, Vice President et Chief AI Scientist de Meta prend la parole… »

Déjà là j’ai un gros doute… Zack veut réfléchir à notre place…

Droz

J’AI UN PRIX TURING.
Quand je serais grand, je serais trop fort et je ferais une IA mieux que celles que j’ai pas vu venir.
J’AI UN PRIX TURING.
Elle serait révolutionnaire, car elle serait plus intelligente et qu’elle apprendrait mieux.
J’AI UN PRIX TURING.
Du coup je fais un projet Git vide que j’appelle JEPA en hommage au prix que je JEPA eus tout seul, aux IA génératives que JEPA a vu venir et que JEPA réussi à faire copier par mon équipe que JEPA.
J’AI UN PRIX TURING.
Tout le monde a le droit de le remplir c’est génial, mais c’est méta qui prends les droits et la thune faut pas déconner quand même, je me contenterais de la gloire.
J’AI UN PRIX TURING.
Je vais mètre des suppositoires sur mon diagramme. Ils ne pourront pas dire que je ne les avais pas subtilement prévenus.
J’AI UN PRIX TURING.

Werehog

C’est vrai que c’est un peu le discours du mec qui a raté le coche commercial mais qui reste néanmoins passionné par son domaine, comme tous les chercheurs. De manière générale je déteste quand même les gens qui disent que ce que fait le voisin c’est de la m*rde. Et généralement ce genre de recherches ça sort un truc intéressant au bout de 20 ans, et encore. Pendant ce temps OpenAI s’en met plein les poches et Meta… comment dire… faut bien rebondir après la déculottée du metavers et rassurer un peu les actionnaires.

keyplus

les chats ayant planifié la domination du monde dans 100 ans il serait plus utile d’apprendre à miauler aux ia.

Rainforce

Droz:

J’AI UN PRIX TURING.
Quand je serais grand, je serais trop fort et je ferais une IA mieux que celles que j’ai pas vu venir.
J’AI UN PRIX TURING.
Elle serait révolutionnaire, car elle serait plus intelligente et qu’elle apprendrait mieux.
J’AI UN PRIX TURING.
Du coup je fais un projet Git vide que j’appelle JEPA en hommage au prix que je JEPA eus tout seul, aux IA génératives que JEPA a vu venir et que JEPA réussi à faire copier par mon équipe que JEPA.
J’AI UN PRIX TURING.
Tout le monde a le droit de le remplir c’est génial, mais c’est méta qui prends les droits et la thune faut pas déconner quand même, je me contenterais de la gloire.
J’AI UN PRIX TURING.
Je vais mètre des suppositoires sur mon diagramme. Ils ne pourront pas dire que je ne les avais pas subtilement prévenus.
J’AI UN PRIX TURING.

C’est mieux qu’un prix Tuning.

a-snowboard

De toute façon j’ai du mal à voir comment une vrai IA peut emmerger juste en donnant des données.

Les enfants apprennent parce que quelqu’un leur apprends et leur explique le pourquoi du comment.

Exemple tout bête en photo. Je peux transmettre à l’IA mes photos avant et après.
Aucune IA n’est en mesure de comprendre pourquoi je corrige de telle manière une photo avec tel outil.

Et pour ça, faut des gens qui enseignent. C’est pas des données qui feront le travail. Les données c’est juste les exemples.

eaglestorm

pour ma part je pense qu’ils sont vraiment pas loin de la conduite autonome niveau 5

c’est largement envisageable au faisant conduire une voiture par un humain, voiture équipée de tous les équipements de détection présents dans le modèle final

les données de la conduite humaine étant associées à toutes les informations recueillies par les capteurs permettent de constituer un base de données permettant d’entrainer une IA tel que ça se passe dans les autres domaines

avec des dizaines de véhicules d’entrainement parcourant des 100e de milliers de kilomètres, il est largement envisageable de constituer une base de données suffisamment importante et large pour pouvoir former un cerveau numérique en capacité de réagir à n’importe quel environnement et à n’importe quelle situation

eaglestorm

De toute façon j’ai du mal à voir comment une vrai IA peut emmerger juste en donnant des données.

le cerveau numérique (l’IA) est soumis aux stimuli (la base de données), et si il est bien construit, ces stimuli permettront de façonner les connexions nécessaires à son fonctionnement une fois en condition de devoir résoudre un problème

vois un peu le deep learning comme une stimulation par choc électrique d’un cerveau vierge, ces chocs électrique simulant les interactions que peut avoir un cerveau avec son environnement, si il est bien construit, ça lui permet de créer des connexion neuronales qui engendre expérience, mémoire…

on est au tout début de l’aventure, on va pas pouvoir concurrencer tout de suite la nature qui a des millions d’années d’avance, mais ça viendra

eaglestorm

ce qui nous manque principalement, ce sont les architectures neuronales permettant d’imiter le fonctionnement des systèmes nerveux de la nature, cette limitation est à la fois au niveau des concepts (comment organiser tout ça), et à la fois dans nos limites technologiques, la nature est beaucoup plus performantes pour créer des microstructures hyper complexes, mais avec un peu de temps, on y arrivera, y a pas de raison

pecore