Wikipedia : un moteur de recherche en langage naturel

Alexandre Laurent
Publié le 14 mai 2008 à 09h14
Rêve de linguiste, la recherche en langage naturel peut désormais être testée par les internautes sur les contenus de Wikipedia par l'intermédiaire d'un outil conçu par la société Powerset. Reposant sur l'interprétation de phrases construites plutôt que sur une sélection de mots clé et d'opérateurs booléens, la recherche en langage naturel est censée permettre de s'adresser à un moteur de recherche comme on parlerait à un interlocuteur.

Soutenu par Tim Berners Lee, l'un des pères fondateurs du Web actuel, le principe de « recherche naturelle » consiste à analyser de façon sémantique et syntaxique la proposition entrée à l'internaute, voir comment les mots employés par l'internaute s'articulent, pour déterminer le sens exact de sa recherche. Plutôt que de saisir des mots disparates, on posera donc sa question sous la forme d'une phrase complète.

« Contrairement aux autres moteurs de recherche, qui indexent des mots clé, Powerset effectue une analyse linguistique des phrases qu'il est amené à lire », explique la firme dans un communiqué. Autrement dit : comprendre le sens des mots au lieu de simplement repérer leurs occurrences dans d'éventuelles pages de résultat.

015E000001320480-photo-powerset-recherche-naturelle-dans-wikipedia.jpg


En gestation depuis plus de deux ans, le projet de Powerset lui a valu l'attention des plus grands tels que Google ou Microsoft qui, selon la rumeur, aurait envisagé de racheter cette société fondée en 2005 et basée à San Francisco. Cantonné aux pages anglophones de Wikipedia, Powerset offre effectivement des résultats différents de ceux que retournent un moteur traditionnel, et se révèle très efficace sur certaines requêtes. En ira-t-il de même lorsque Powerset tentera d'indexer l'infinie variété des pages présentes sur le Web ?
Alexandre Laurent
Par Alexandre Laurent

Alex, responsable des rédactions. Venu au hardware par goût pour les composants qui fument quand on les maltraite, passé depuis par tout ce qu'on peut de près ou de loin ranger dans la case high-tech, que ça concerne le grand public, l'entreprise, l'informatique ou Internet. Milite pour la réhabilitation de Après que + indicatif à l'écrit comme à l'oral, grand amateur de loutres devant l'éternel, littéraire pour cause de vocation scientifique contrariée, fan de RTS qui le lui rendent bien mal.

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !
Commentaires (0)
Rejoignez la communauté Clubic
Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.
Abonnez-vous à notre newsletter !

Recevez un résumé quotidien de l'actu technologique.

Désinscrivez-vous via le lien de désinscription présent sur nos newsletters ou écrivez à : [email protected]. en savoir plus sur le traitement de données personnelles