Il y a quelques semaines, Google lançait un algorithme nommé BERT dans le but de permettre une meilleure compréhension des requêtes sur son moteur de recherche. À partir du 9 décembre, ce nouvel algorithme sera disponible dans 70 nouvelles langues, dont le français.
BERT (pour « Bidirectional Encoder Representations from Transformers ») est présenté par Google comme « la plus grande amélioration du Search depuis cinq ans ».
Plus proche du contexte
Le premier déploiement de BERT, qui a eu lieu fin octobre, n'a concerné que les requêtes exprimées en langue anglaise. Pandu Nayak, le vice-président de Google, avait alors expliqué le défi présenté par l'algorithme, qui doit comprendre un langage plus proche du parlé naturel. Dans un communiqué, il a ainsi déclaré : « Notre travail, consiste à comprendre ce que vous cherchez et à faire remonter l'information utile du Web, peu importe la façon dont vous avez écrit ou combiné les mots de votre requête. Mais parfois ça ne marche pas très bien, particulièrement pour des requêtes complexes ou conversationnelles. D'ailleurs, c'est l'une des raisons pour lesquelles les gens utilisent souvent des suites de "mots-clés", qu'ils pensent que l'on comprendra mieux. Mais ce n'est pas de cette manière qu'ils poseraient une question naturellement ».La solution revient alors à considérer « des modèles qui traitent les mots en relation avec tous les autres mots d'une phrase, plutôt que l'un après l'autre ». En d'autres termes, de tenir compte d'un contexte. Par exemple, dans le cas de la requête « Faut-il un visa pour voyager du Brésil vers les Etats-Unis », le mot « vers » sera désormais pris en compte. L'algorithme comprendra ainsi que la question porte sur un voyage à destination des Etats-Unis, et non l'inverse.
Répondre aux besoins des enceintes naturelles
L'algorithme doit ainsi entendre un langage plus naturel, bien que Pandu Nayak admette lui-même que « ça ne marche pas toujours ». Il rappelle aussi que « la compréhension du langage reste un défi ». En outre, malgré l'extension de BERT à 70 nouvelles langues, l'amélioration ne devrait finalement concerner qu'une requête sur dix, la majorité de celles-ci étant souvent constituées uniquement de mots-clés.Néanmoins, comme pointe le Monde, l'algorithme doit aussi répondre aux besoins des enceintes connectées, désormais achetées par un français sur dix. De fait, celles-ci reçoivent, le plus souvent, des requêtes formulées en langage naturel.
Le déploiement de BERT sera scruté par des professionnels, notamment du référencement sur Internet, celui-ci pouvant avoir un impact sur le chiffre d'affaires d'une entreprise. Google assure à ce propos que BERT n'aura pas d'impact considérable concernant les sites vers lesquels il renvoie.
Source : Le Monde