Microsoft souhaite optimiser la saisie des requêtes au sein de son moteur de recherche Bing. Pour ce faire, l'entreprise a développé un correcteur orthographique multilingue.
Baptisé Speller100, l'outil est capable de prendre en charge pas moins d'une centaine de langues et a été optimisé avec des algorithmes d'intelligence artificielle.
L'orthographe au cœur de Bing
Bien que la part de marché de Bing soit moindre comparée à celle de Google, l'entreprise entend retourner des résultats plus pertinents. Toutefois, au-delà de la qualité de son index, la société explique qu'assez régulièrement les requêtes des internautes seraient mal orthographiées.
Plus précisément, Microsoft explique que 15% des mots-clés présenteraient une faute. De fait, l'expérience utilisateur sur la page des résultats s'en trouve affectée et l'internaute n'obtient pas d'emblée la réponse à sa question. Jingwen Lu, Jidong Long et Rangan Majumder, respectivement Responsable du département des sciences appliquées, Ingénieur logiciel et Vice-président, expliquent ainsi :
« La correction orthographique est le tout premier composant dans le développement d'une requête sur Bing parce que déterminer la bonne orthographe pour la requête de l'utilisateur entraîne une amélioration de tous les composants de la chaîne de recherche ».
Plus de langues pour plus d'interactions
Auparavant, la correction orthographique ne portait que sur une douzaine de langues. Désormais, celle-ci s'applique à plus d'une centaine. Les algorithmes ont été entraînés par des contenus publiés sur le Web et grâce aux retours des utilisateurs. Cependant, ce modèle ne se révèle performant que pour langues les plus utilisées sur la Toile.
Pour mettre au point Speller100, Microsoft s'est intéressée aux origines d'une langue et a dressé des familles afin de corréler certaines similarités. Par ailleurs, la société communique sur le concept Zero shot learning : ce dispositif permet à l'algorithme d'apprendre immédiatement l'orthographe d'un mot sans devoir être entraîné par une source de données au préalable.
« Imaginez que quelqu'un vous apprenne à épeler en anglais, et automatiquement, vous apprenez également à épeler en allemand, en néerlandais, en afrikaans, en écossais ou en luxembourgeois ».
Ces efforts ont permis de réduire de 30% le nombre de pages retournées sans aucun résultat. La société a également observé davantage d'interactions sur les suggestions de corrections orthographiques ou encore sur le nombre de clics enregistrés sur les pages des résultats.
Source : Microsoft