Gurdeep Singh Pall, vice-président des logiciels de VoIP Skype et Lync chez Microsoft, dévoilait récemment une application permettant de traduire à la volée une conversation entre deux interlocuteurs ne parlant pas la même langue. L'outil fait usage de plusieurs technologies, qu'il s'agisse de la reconnaissance vocale, de la traduction automatisée ou encore de la synthèse vocale.
Selon Vikram Dendi, travaillant avec les équipes de Microsoft Research, les différences notables entre la langue écrite et le langage oral formaient l'un des points fondamentaux qui n'avaient pas été pris en compte dans les précédentes tentatives du genre. A l'heure actuelle, les systèmes de traduction automatique disposent d'un algorithme se basant presque uniquement sur des textes littéraires. Les intonations, les pauses ou les questions dont la syntaxe est tournée à l'affirmative n'étaient donc pas correctement reconnues. Microsoft a entrepris d'avoir une approche plus naturelle pour les conversations audio.
Le magazine ieee.org rapporte ainsi que Microsoft s'est appuyé sur des textes et du contenu en ligne déjà traduit d'une langue à l'autre afin de pouvoir identifier chacune des phrases et leurs équivalences dans une langue étrangère. Cette approche a permis d'optimiser les réseaux de neurones artificiels et donc l'algorithme de traduction automatique.
Les chercheurs se sont ensuite tournés vers les réseaux communautaires de part leur structure linguistique s'approchant davantage du langage oral que de la langue écrite. Pour ce faire, il a tout d'abord fallu mettre en œuvre un algorithme capable de normaliser les différentes publications sur Facebook, Twitter et cie pour obtenir un format unique capable d'être traité par de simples phrases. Selon M. Dendi, ce procédé aurait permis d'optimiser la qualité de la traduction sur les réseaux communautaires d'environ 6%. « Bien sûr il y a encore beaucoup de travail à faire, mais (...) cela a vraiment fait avancer notre compréhension et la traduction de ce type de données ».
Cet été, à l'occasion de la Coupe du Monde de Football, l'équipe de Bing a déployé son assistant de traduction automatique sur Twitter. L'on imagine que ces données ont été utilisées dans le cadre de ces travaux.
Le plugin Skype Translator devrait être disponible en bêta un peu plus tard cette année.