D'après Google, l'algorithme BERT (pour « Bidirectional Encoder Representations from Transformers ») serait « la plus grande amélioration du Search depuis cinq ans, et l'un des plus grands bons en avant de l'histoire du moteur de recherche ».
Si cette amélioration ne doit finalement concerner qu'une requête sur dix, elle met en place une meilleure compréhension de la linguistique.
Requêtes et contextes
Ce nouvel algorithme, mis au point par le géant américain au cours de la dernière décennie, doit permettre de mieux comprendre ce que recherche l'utilisateur grâce à des techniques de traitement automatique du langage naturel (TALN, aussi appelé ingénierie linguistique).Sur le blog de Google, Pandu Nayak, vice-président du secteur de recherche du groupe, donne des exemples explicitant ce gain de sens. Il prend l'exemple de la recherche : « Peut-on aller chercher les médicaments de quelqu'un d'autre à la pharmacie ? ». Jusque-là, Google repérait les termes-clés de la requête. Ici, il s'agit essentiellement de « médicaments » et de « pharmacie ». Ensuite, il renvoyait avant tout des sites génériques liés à ces mots-clés : le fonctionnement d'une ordonnance, par exemple.
Selon Pandu Nayak, le moteur de recherche doit désormais considérer la phrase comme un ensemble, et comprendre son contexte. Dans l'exemple, la mention « de quelqu'un d'autre » est importante. Avec ce nouvel algorithme, Google renverra des résultats indiquant si un ami ou un membre de la famille peut retirer les médicaments d'un proche en pharmacie. Le moteur de recherche sera donc en mesure de dégager le sens global d'une phrase.
« Le problème de la recherche n'est pas résolu »
Dans un premier temps, cette amélioration devrait concerner environ 10 % des requêtes faites sur Google, et ne sera accessible qu'aux recherches anglophones. Mais Pandu Nayak envisage déjà les autres langues : « Nous essayons de mettre en place l'algorithme BERT pour améliorer le moteur dans le reste du monde. Une caractéristique intéressante sur ces systèmes réside dans leur apprentissage continu d'une langue, ce qui permet d'appliquer leurs enseignements à d'autres. Nous pouvons réaliser des modèles tirés d'améliorations de l'anglais (une langue concernant une grande majorité du contenu Web) et les appliquer à d'autres langues ».Le vice-président désigne comme un « défi permanent » cette question de la linguistique, chaque langue conservant ses spécificités. Il admet que BERT doit encore évoluer et apprendre : « Vous poserez encore des énigmes à Google de temps en temps », dit-il.
D'après Google, le nouvel algorithme aurait été mis en place récemment. Les responsables du moteur de recherche ont déclaré que cette amélioration ne redirigerait pas fondamentalement le trafic Web. Néanmoins, chaque modification du moteur, même légère, est systématiquement scrutée par les professionnels. Pour citer The Verge, « des compagnies ont vécu et sont mortes suite à des changements dans le référencement de Google ».
Source : Blog Google