Se faire comprendre à l'étranger n'a rien d'une sinécure, particulièrement lorsqu'un européen s'invite en Asie, ou vice-versa. Afin de faciliter les échanges, l'opérateur japonais NTT Docomo développe depuis plusieurs années des dispositifs de traduction instantanés : deux d'entre eux ont fait leurs débuts publics cette semaine à l'occasion du salon Ceatec.
Le premier, dévoilé en novembre dernier et prochainement disponible, associe reconnaissance et synthèse vocale, de façon à faire de votre téléphone portable un véritable interprète. L'application qui en découle, compatible avec une douzaine de langues dont le français, propose donc à l'utilisateur de dicter la phrase qu'il souhaiterait traduire. Le son ainsi capturé est envoyé vers les serveurs de Docomo, où un moteur de reconnaissance vocale se chargera de transcrire la phrase en texte. Celle-ci sera alors traduite, avant que ne soit renvoyé au téléphone l'équivalent dans la langue cible, aussi bien sous forme de texte que sous forme de son, grâce à l'emploi de la synthèse vocale.
Pour peu que le réseau soit de bonne facture (NTT Docomo profite de ces démonstrations pour vanter les mérites de son réseau 4G), l'aller retour et la traduction se font en une ou deux secondes, et l'on peut ensuite tourner son téléphone vers son correspondant pour que sa réponse soit, à son tour, traduite. Lors de sa mise sur le marché, l'application devrait par ailleurs proposer une seconde option permettant de profiter de cet outil de traduction dans le cadre d'une communication téléphonique, un serveur vocal opéré par Docomo jouant alors les interprètes entre les deux parties de la conversation.
Le second se présente en réalité comme une évolution de l'application de traduction de menu que nous vous présentions pendant le Ceatec 2011. Ce traducteur texte exploite donc l'appareil photo de votre smartphone : au centre de l'écran, une zone rectangulaire invite à cibler précisément le ou les termes que l'on cherche à traduire. Inutile de déclencher manuellement la photo, le dialogue est permanent entre le serveur distant qui gère reconnaissance de caractères ou dictionnaires et le téléphone.
Docomo exploite maintenant la réalité augmentée, et superpose aux termes de la recherche la traduction. Si l'on fait défiler son téléphone sur une carte de restaurant, on voit donc successivement s'afficher les éléments du menu dans la langue de son choix, là encore si des latences dues au réseau ne viennent pas compromettre la fluidité de l'opération. Non content de cette refonte ergonomique, Docomo a étendu la portée de ses dictionnaires, ce qui fait que l'application est maintenant censée permettre de traduire à la volée la plupart des informations courantes de signalétique (cartes de restaurant mais aussi panneaux de circulation ou d'information publique, etc.).