ChatGPT ouvre les yeux : vous allez bientôt papoter avec un assistant IA qui voit et comprend tout

Par Naïm Bada, Spécialiste logiciel.

Publié le 19 novembre 2024 à 05h14

L'intelligence artificielle franchit un nouveau cap avec l'arrivée imminente du mode Live Camera de ChatGPT. OpenAI prépare discrètement le déploiement d'une fonctionnalité qui s'inscrit dans une stratégie plus large de développement d'agents IA autonomes.

Depuis la présentation de GPT-4o en mai 2024, les utilisateurs attendent cette capacité visuelle. L'assistant multimodal va désormais pouvoir analyser en temps réel ce qui se trouve devant sa caméra, dans un contexte de compétition féroce avec d'autres acteurs du secteur comme Anthropic.

La vision en temps réel, nouvelle frontière de l'IA

Les premières versions alpha ont déjà impressionné les testeurs. Un utilisateur, Manuel Sainsily, a même comparé l'expérience à « un FaceTime avec un ami super intelligent », capable d'analyser en temps réel son nouvel animal de compagnie. Les indices repérés dans la version bêta de l'application suggèrent que la fonctionnalité sera baptisée Live Camera. Un avertissement intéressant prévient déjà les utilisateurs : pas question d'utiliser cette IA pour des décisions critiques concernant la santé ou la navigation.

...

Live Camera sera d'abord réservée aux abonnés ChatGPT Plus et Enterprise, avec un déploiement prévu dans les prochaines semaines sur iOS et Android. Cette stratégie prudente permettra de tester et d'affiner la technologie avant un déploiement plus large. La fonctionnalité devrait également rejoindre les versions Windows et macOS à terme. On avait d'ailleurs eu droit à une démo de cette version pour Mac au printemps dernier.

La bataille des agents intelligents

Cette fonctionnalité s'inscrit dans une stratégie plus large de développement d'agents IA capables d'interagir avec l'environnement. OpenAI n'est pas seul dans cette course : Anthropic a déjà présenté des capacités similaires d'automatisation de tâches informatiques.

Sam Altman, P.-D.G. d'OpenAI, a récemment souligné que « les agents seront la prochaine grande avancée ». L'entreprise développe en interne un projet baptisé Operator, capable d'exécuter des tâches autonomes dans un navigateur web, directement en concurrence avec les solutions d'Anthropic. Google n'est pas en reste avec Gemini, qui prépare sa propre version 2.0 pour décembre 2024. La firme de Mountain View travaille également sur des capacités de vision en temps réel avec son projet Astra.

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services

Sources : Manuel Sainsily sur X.com, Neowin

Par Naïm Bada

Spécialiste logiciel

OpenAI

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (4)

alsaco67

Et parler , échanger, argumenter avec une vraie intelligence, ce n’est pas mieux ?
Quand je vois le niveau intellectuel de certains gamins (et adultes) qui, à la moindre question , plongent sur Google ou comptent sur une réponse générée par une « IA », cela promet …

ovancantfort

Parler avec des humains et réfléchir par soi - même, pfff, c’est tellement has - been…

ChezDebarras

la réponse est dans ta question/ton interrogation : il vaut parfois mieux parler à une IA plutôt qu’à certains gamins décérébrés (qui ont, par choix et par paresse, renoncé à utiliser leur tête pour penser par eux mêmes, préférant #répéter)

Blackalf

Je vois les mêmes, ceux qui ne prennent plus la peine d’apprendre et retenir quoi que ce soit et discutent le téléphone à la main pour aller chercher au fur et à mesure sur le Net de quoi tenir une conversation, parce qu’ils n’ont guère de connaissances personnelles.