Elle est mignonne, docile, serviable et jamais en colère; elle, c'est la demoiselle qui se dandine sur l'écran d'un smartphone installé sur le tableau de bord reconstitué d'une voiture. Le pseudo-conducteur, en l'occurrence un ingénieur de la société Fujitsu Ten, la sollicite:
- « Il n'y aurait pas un parking dans les parages ? »
- « Si, 20 même. Le plus proche est à 300 mètres, mais il est plein », répond la préposée.
- « Trouves-en un où il y une place libre ! », s'impatiente le conducteur.
- « J'en ai recensé 10, dont un à 500 mètres ! ».
- « Eh bien, on y va ! », s'exclame le chauffeur soulagé.
Et la demoiselle de transférer alors par liaison sans fil les données de la destination au système de radionavigation qui prend le relais pour guider l'automobile.
On aurait aussi pu lui dire:
- j'ai une petite fin.
et elle aurait répondu:
- Voulez-vous que je cherche un restaurant ?
- Oui, bonne idée.
- Quel genre de cuisine ?
- Hmmm, française.
- Il y a deux restaurants français dans les environs.
etc...
Tout se fait par la voix, et en mode de conversation naturelle, tel est le principal atout de ce système qui reçoit de nombreuses informations par réseau cellulaire de télécommunications. « Nous avons des partenariats avec plusieurs sociétés (comme les gérants de sites de restaurants ou de parking) pour obtenir toutes ces informations », explique l'ingénieur de Fujitsu Ten.
Mais pourquoi est-il nécessaire qu'une figurine se contorsionne pour donner ces indications ? Réponse: "« parce que c'est plus humain et agréable de parler à une fille mignonne qu'à un austère smartphone ».
- « Certes, mais c'est ciblé pour les hommes !! »
- « Oui »
Cette demoiselle virtuelle agit un peu comme un passager qui guiderait son chauffeur. A une différence près vous, diront les misogynes japonais: « elle, au moins, elle sait lire les cartes ! »
Dans la logique de ne pas parler à des machines mais à des individus, il y a plus incarné encore, en la personne du robot "Hana" imaginé par Denso, un équipementier nippon affilié au premier constructeur mondial, le japonais Toyota.
Hana, sorte de marionnette androïde, est assis sur le tableau de bord et entretient la conversation avec l'automobiliste comme pourrait le faire un passager, mais en prenant en compte des informations électroniques qu'il reçoit de la part de la voiture.
Par exemple, si, comme dans le manga de J.P. Nishi, le conducteur a les yeux qui tombent, un rythme cardiaque trop élevé, dépasse la vitesse limite ou a une soudaine baisse d'attention, Hana va le signaler. Il sait aussi indiquer qu'il y a un feu rouge à quelques dizaines de mètres, ou une voiture qui arrive sur la gauche au croisement.
A en juger par le visage réjoui de la grand-mère surprise à converser avec cette créature dans un simulateur dédié au Tokyo Motor Show, l'idée paraît plutôt séduisante. D'ailleurs, Nissan avait présenté un concept similaire il y a plusieurs années et les Japonais ne trouvent absolument pas ridicule ce genre d'invention, bien au contraire. Après tout, on a l'air moins bête de dialoguer avec un robot qui ressemble à une poupée qu'avec une voiture !
De façon plus générale, les Nippons ne voient pas comme une ineptie le fait de converser avec un personnage qui n'est pour nous qu'un vulgaire objet. Car pour eux, il a une âme. Paradoxalement, ils sont beaucoup plus réticents à utiliser une oreillette Bluetooth pour parler en public à une personne distante. Ils ont dans ce cas l'impression de s'exprimer dans le vide à l'attention de personne.
Qu'ils soient personnifiés ou non, les systèmes de reconnaissance et synthèse vocales pour l'automobile existent depuis des années, mais ont encore du mal à être parfaitement au point. D'où le fait qu'outre les constructeurs eux-mêmes, les équipementiers (Denso, Clarion, Pioneer) mais aussi les opérateurs de télécommunications (NTT Docomo ou KDDI au Japon) travaillent sur le sujet, parfois en partenariat avec de gros acteurs de l'informatique comme le fait par exemple Clarion avec le géant américain de l'internet Google.
L'une des difficultés de ces dispositifs est qu'ils doivent dans l'idéal être plurilocuteurs (plusieurs personnes avec une voix différente peuvent être comprises sans apprentissage préalable) et décrypter un nombre important de mots énoncés sous forme de phrases, de façon fluide et naturelle, sans modifier son intination habituelle et sans hurler devant le micro.
Or, les systèmes les plus simples à concevoir sont généralement différents: ils sont monolocuteurs (une seule personne dont la voix aura été enseignée) avec un dictionnaire élargi, ou bien plurilocuteurs mais avec un vocabulaire très restreint.
De surcroît, concèdent leurs concepteurs, il faut impérativement que l'usage d'une telle technologie présente des avantages réels par rapport au fait d'appuyer sur des boutons ou de lire une indication sur un écran. Si le conducteur doit s'y prendre à trois ou quatre reprises pour chaque phrase avant d'être compris, il renonce illico à cette fonction. Pourtant, cela participe d'une logique générale de simplification de la conduite et, dans l'idéal, d'amélioration de la sécurité, avec un objectif : « 100% sûr, zéro accident ».
« Actuellement, les véhicules se déplacent grâce à un conducteur qui actionne un volant et appuie sur des pédales, mais à l'avenir ils iront seuls là où on leur dira, en prenant en compte la condition physique du conducteur, l'état des routes et du trafic via la combinaison d'informations obtenues par des capteurs et autres technologies électroniques », prédit dans un article scientifique le chercheur Teruhisa Tsujino.