Dans un nouveau brevet, Apple explore la possibilité pour Siri de détecter le mouvement de nos lèvres, améliorant ainsi sa fiabilité. Cette technologie permettrait d’interpeller l’assistant vocal sans que le microphone ait besoin d’être constamment activé.
Apple n’est peut-être pas encore prêt à révolutionner le marché des robots conversationnels, mais il entend continuer d’améliorer Siri, son célèbre assistant personnel présent sur tous les appareils de la marque. La firme à la pomme vient de déposer un brevet au sujet d’une technologie qui pourrait permettre au bot de lire sur les lèvres.
Siri bientôt capable de réagir au mouvement de nos lèvres ?
L’un des problèmes actuels de Siri (et de la plupart des assistants vocaux) réside dans sa difficulté à entendre, de manière totalement fiable, les ordres qui lui sont donnés à l’oral, en particulier lorsque des bruits ambiants interfèrent.
Apple pourrait avoir trouvé une parade à ce problème, comme le suggère un brevet récemment déposé par la firme. L‘entreprise y décrit la façon dont la détection des mouvements de la bouche et de la tête pourrait améliorer la précision et la réactivité de Siri.
« [Les données] sont réceptionnées à partir d’un capteur de mouvement, par exemple, qui enregistre les gestes d'un utilisateur lorsqu’il prononce une commande vocale », explique le brevet. « Ces données sont ensuite analysées, pour voir si une partie de ces mouvements correspond à un modèle de référence pour un mot ou un ensemble de mots. »
En quoi cela pourrait-il améliorer la reconnaissance vocale ?
Concrètement, Siri ne serait pas capable de lire des conversations entières sur nos lèvres, mais il se révélerait juste assez performant pour reconnaître le mouvement labial de commandes simples et courtes, comme « Dis Siri » ou « Chanson suivante ». Et rien que cela pourrait déjà changer la donne.
En effet, l'idée derrière cette technologie n’est pas de créer des appareils sans microphones, mais plutôt de permettre à Apple de désactiver ces derniers qui, actuellement, sont constamment à l’affût de commandes vocales éventuelles. Cette détection audio continue, souligne Apple, consomme beaucoup d’énergie et de bande passante sur nos différents appareils. À l’inverse, les capteurs de mouvement, tels que les accéléromètres et les gyroscopes, ont l’avantage de se montrer plus économes.
Il suffirait alors que la détection de mouvement soit suffisamment rapide pour reconnaître le mot « Siri » sur nos lèvres, pour que l’appareil active les microphones, juste à temps pour capter le reste de la commande vocale. Autre avantage : s’agissant d’un procédé de détection de mouvement (plutôt que d’une reconnaissance visuelle par le biais d’une caméra, par exemple), une telle option pourrait, en théorie, fonctionner avec des appareils comme les AirPods ou l’Apple Vision Pro.
Source : AppleInsider