opera aria image understanding

Ce n’est pas la première fois que le navigateur norvégien s’inspire de Google pour déployer de nouvelles fonctionnalités. Une stratégie qui vise à convaincre les internautes de délaisser Chrome pour Opera, malgré le fort retard accusé par ce dernier.

D’abord Aria pour concurrencer Gemini, puis l’intégration de Gemini à Aria pour renforcer la puissance de son intelligence artificielle maison, et maintenant « Image Understanting » pour rivaliser avec Google Lens. Opera s’affranchit peu à peu de l’intégration des services Google tels quels au profit de ses propres technologies, cherchant à promouvoir des fonctionnalités alternatives tout en tirant profit de ce que sait déjà faire une concurrence bien établie. Et avec la présentation de son module de reconnaissance d’images intégré à son agent conversationnel, le navigateur web entend bien gagner encore davantage en autonomie vis-à-vis de son rival américain.

Une option fonctionnelle qui doit encore s'affiner

C’est dans un billet de blog officiel qu’Opera a annoncé le déploiement d’une nouvelle fonctionnalité de reconnaissance d’images propulsée par son intelligence artificielle Aria sur Android. À l’instar de Google Lens, Image Understanding doit pouvoir analyser n’importe quel cliché à partir de la caméra ou de la galerie du smartphone, de manière à offrir aux internautes des informations complémentaires concernant un objet ou l’environnement dans lequel ils évoluent.

De manière concrète, Image Understanding est intégré à Aria, elle-même intégrée au navigateur Opera. Pour y accéder, il faudra accéder au menu du profil, en bas à droite de la fenêtre de navigation, sélectionner l’entrée « Aria – IA du navigateur », puis presser l’icône caméra dans la barre de prompt. Une fois l’objet ou le paysage sur lequel on souhaite obtenir des informations complémentaires pris en photo, il convient de toucher une deuxième fois le déclencheur de la caméra pour charger le cliché dans la barre de prompt d’Aria. Libre à chacun et chacun, ensuite, de poser à l’agent conversationnel d’Opera une question relative à l’image pour en savoir plus sur le contenu de la photo.

Avec Image Understanding, Aria peut analyser des clichés pour dispenser des informations compélmentaires issues du web © Opera
Avec Image Understanding, Aria peut analyser des clichés pour dispenser des informations compélmentaires issues du web © Opera

La reconnaissance d’image basée sur Aria fonctionne aussi pour les éléments de la galerie. Depuis l’icône +, toujours dans la barre de prompt, il est possible de sélectionner n’importe quelle photo, et de la soumettre à Aria de la même manière que les clichés capturés à la volée.

Testée à la rédaction, l’option est fonctionnelle sans pour autant faire preuve d’une précision impeccable. À titre d’exemple, nous avons obtenu des informations correctes au sujet de types de plantes, et incorrectes concernant la détection d’une race de chat. Nous avons néanmoins apprécié l’intégration de liens sources dans les réponses, qui nous ont permis d’obtenir davantage de détails sur les éléments pris en photo si nous le souhaitions.

À noter également qu’Image Understanding n’est pour le moment disponible que dans la version 85 d’Opera Beta, en prévision d’un lancement officiel dans la version stable du navigateur d’ici quelques semaines.

La fonction Image Understanding d'Aria sait reconnaître des plantes, mais peine avec les chats © Clubic

Aria, axe de développement majeur pour Opera

Qu’Opera planche sur une telle fonctionnalité n’a rien d’étonnant, alors que la course aux intelligences artificielles ne présente aucun signe d’essoufflement et que le nombre d’utilisateurs ne cesse de gonfler. Présentée comme l’une des principales forces de sa refonte Opera One, Aria constitue aujourd’hui un axe de développement majeur pour l’entreprise norvégienne qui s’est associée à Open AI et Google pour intégrer plus de 150 variantes de LLM issus d’une cinquantaine de familles de modèles, parmi lesquels GPT (OpenAI) et Gemini (Google).

La société s’est aussi attachée à faire de son chatbot un outil polyvalent (interrogation de la base de données et connexion au web pour obtenir des réponses plus récentes, lecture à voix haute des réponses) et multimodal (prise en charge de texte, d’image, de voix).

En déléguant le développement des LLM à d’autres entreprises qui le font tout aussi bien, Opera entend donc concentrer sa force de développement sur un service d’agrégation et de fusion des grands modèles de langage pour offrir à ses utilisateurs et utilisatrices un agent conversationnel plus riche. Mais pour rattraper son retard en termes d’adoption par les internautes (2,41% de pdm sur ordinateur et 2,04% sur mobile en septembre 2024), il va encore falloir travailler dur.

Opera
  • settingsMoteur de rendu : Chromium
  • extensionExtensions disponibles
  • groupCible : généraliste
  • center_focus_strongParticularité : barre d'application tierces
  • devicesPlateformes : bureau & mobile
8 / 10

Opera est un navigateur web polyvalent et personnalisable, intégrant une multitude de fonctionnalités distinctives. Il propose un bloqueur de publicité intégré, un service VPN gratuit, et un portail d'actualités sur mesure, faisant de lui un choix privilégié pour les utilisateurs attentifs à la sécurité et à la confidentialité. Des fonctionnalités uniques comme l'outil d'instantané et la barre latérale rendent la navigation et la recherche plus pratiques.

Les plus
  • Speed Dial et barre latérale très efficaces
  • Excellentes performances
  • Environnement et fonctionnalités orientés productivité