Project Astra : Google présente un assistant virtuel boosté à l'IA qui voit ce que vous voyez

Par Mathieu Grumiaux, Expert maison connectée.

Publié le 14 mai 2024 à 20h45

Lors de la Google I/O 2024, le moteur de recherche a présenté un nouvel assistant virtuel, Project Astra, fondé sur le modèle de langage Gemini, capable d'analyser de la vidéo, de la voix et du texte pour répondre à toutes les questions.

Les heures de Google Assistant semblent désormais comptées. Google vient d'annoncer, lors de sa conférence Google I/O consacrée à ses innovations logicielles, un nouvel assistant nommé, pour le moment, Project Astra. Ce dernier s'appuie, sans surprise, sur le modèle de langage de la marque américaine, Gemini. Ce dernier utilise la puissance de calcul de Google pour analyser du texte, de la voix et de l'image afin d'obtenir des réponses contextuelles à chaque question posée.

Un assistant toujours à l'écoute et qui voit ce que vous voyez

Project Astra n'a pas été présenté sur scène, mais à travers une vidéo, filmée d'une traite et sans montage, selon les équipes de Google. Cette technologie n'est pour le moment pas un produit fini, mais un projet de travail de Google DeepMind, l'équipe chargée des recherches en intelligence artificielle.

Dans cet extrait, on peut voir une utilisatrice lancer l'assistant vocal, puis ouvrir la caméra de son smartphone. Ainsi, Project Astra peut voir ce que voit la démonstratrice pour lui fournir des réponses à toutes ses questions.

Dans les exemples mis en scène, Project Astra était capable de comprendre un bout de code filmé par la caméra et de donner des indications pour l'améliorer. Il peut également reconnaître des objets, ou donner des suggestions en fonction des éléments face à lui et des questions posées par l'utilisateur.

La caméra est utilisée pour vous assister et comprendre le contexte © Nicolas Guyot pour Clubic

Un projet de recherche qui préfigure des ambitions de Google dans les prochaines années

Plus fort encore : Project Astra analyse un nombre de données lorsque le téléphone est baladé d'un endroit à l'autre, et en temps réel. Dans cette même vidéo, l'utilisatrice demande où se trouvent ses lunettes, et l'intelligence artificielle est capable de lui rappeler le lieu exact où elles ont été laissées.

Project Astra n'est qu'une preuve de concept et ne sera pas intégrée à Android avant probablement plusieurs mois, voire années. Il se rapproche d'ailleurs énormément de GPT-4o, le dernier modèle de langage d'OpenAI présenté ce lundi 13 mai, et qui possède les mêmes fonctionnalités, avec une voix que l'on pourrait qualifier de plus naturelle.

Les utilisateurs pourront avant cela profiter des avancées de Google dans le domaine de l'intelligence artificielle avec l'intégration de Gemini dans l'ensemble des services Google, notamment sur le moteur de recherche, dans Gmail ou dans les applications de bureautique Google Workspace.

A découvrir

Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025

11 juillet 2025 à 13h53

Comparatifs services

Source : Conférence Google I/O

Par Mathieu Grumiaux

Expert maison connectée

Référencement logiciel

Google

Intelligence artificielle

Keynote Google

Actualités High-Tech

Comparer

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (3)

Bestdoud

Je me demande ce que cela ça donner quand tout fusionnera, intelligence artificielle et robotique
Ils ne sont pas loin

kast_or

J ai maté une bonne partie de la keynote de google.
Même bilan que pour celle d’OpenAI : c’est épatant mais en au final je me vois pas utiliser grand chose de ce qu’ils ont montré.

Un gros effet waouh, mais après…

A part pour chercher dans mon tas de photos et générer un truc de temps en temps pour faire marrer les copains y a beaucoup de trucs un peu gadget.

Mais vu la vitesse à la quelle ça pousse, ils vont peut être finir par faire quelque chose d’utile. Au prix de requête qui consommeront 20 fois plus qu’avant…

arsworld

ça monte l’éventail du panel de reconnaissance de cette IA. Pour la vidéo de présentation ça parait gadget mais finalement c’est complètement ouf la réactivité et la perspicacité de gemini. Si c’est pas un peu bidonné comme leur 1ère demo.