Google Reconnaissance Vocale

L'entreprise californienne a détaillé il y a quelques jours ses différentes astuces pour que Google Assistant puisse comprendre le contexte d'une phrase.

Google a investi beaucoup de ressources dans ses technologies de reconnaissance vocale et continue de faire de gros progrès dans le domaine.

Le problème de la deuxième question et du contexte d'une conversation

Si l'analyse de phrases simples du type « Allume l'ampoule du salon » ou « Quel temps fait-il ? » ne pose plus vraiment de difficultés à Google Assistant, la tenue d'une conversation plus complexe est encore un problème.

Le logiciel doit comprendre le contexte d'une phrase pour pouvoir suivre plus d'une commande à la fois. Imaginons que vous posiez la question : « Quel temps fait-il à Paris? », puis après la réponse donnée par l'assistant vocal vous demandez « Combien de personnes y habitent ? », Google Assistant doit être capable de savoir que le sujet de votre deuxième question est toujours Paris, sans avoir à vous le demander.

Google a donc, quelques jours après sa Google I/O 2022, détaillé plus longuement ses avancées en la matière sur son blog dédié à l'intelligence artificielle.

Google Assistant reformule les phrases grâce à l'apprentissage machine

L'astuce utilisée par les ingénieurs de la marque avec la fonctionnalité « Conversation continue » semble évidente, mais a demandé des années de travail pour y parvenir. Google Assistant va tout simplement s'employer à reformuler la deuxième question en prenant pour sujet celui de la première question. Si la phrase fonctionne, il peut y répondre. Sinon, il mettra un terme à la conversation.

Google donne pour exemple la requête principale « Qui est l'épouse de Superman? » (spoiler : c'est Lois Lane), puis une seconde question « Quand se sont-ils mariés ? ».

Pour reconnaître le sujet de cette phrase, Google Assistant va analyser la requête initiale et décomposer les différents termes. L'intelligence artificielle intervient également pour identifier les termes populaires, en fonction du nombre de recherches effectuées sur Google ou de la popularité des sujets et classer les requêtes secondaires en fonction de leur pertinence afin de supprimer les faux positifs et les erreurs.

De l'apprentissage machine, entraîné sur de très nombreuses phrases d'exemple va enfin générer des questions secondaires pertinentes afin de trouver la bonne reformulation et donner la bonne réponse. Dans notre exemple, Google Assistant comprendra la question « Quand se sont mariés Lois Lane et Superman ? ».

Si « Conversation continue » est déjà l'œuvre dans Google Assistant, ces systèmes ne cessent de s'améliorer au fur et à mesure que les utilisateurs s'en servent sur leur smartphone et le moteur de recherche compte bien arriver à terme à une conversation fluide entre l'homme et la machine.