Depuis presque deux décennies, elle n'avait plus prononcé un seul mot. Aujourd’hui, ce sont ses pensées qui parlent pour elle – via un implant cérébral, un réseau de neurones artificiels et un modèle de synthèse vocale.

La voix est un pouvoir que l’on mesure rarement, jusqu’au jour où elle s’éteint. Après un grave AVC, cette patiente était restée pendant 18 ans incapable de produire un seul mot, et présentait également une quadriplégie, soit une paralysie des quatre membres et du tronc. Sa volonté de s’exprimer, elle, n’avait pas disparu ; mais les muscles, les gestes et l’organe vocal refusaient d’y répondre : une aphasie sévère.
À San Francisco, une équipe de chercheurs pilotée par le neurochirurgien Edward Chang, épaulée par des collègues de Berkeley, a réussi à faire resurgir cette voix à travers la machine. Cela en s’appuyant uniquement sur l’activité de son cerveau et en créant une neuroprothèse vocale ; un sous-ensemble des interfaces cerveau-machine comme celle implantée l'an dernier par Neuralink.
Une IA entraînée sur la pensée
L’expérience ne s’est pas faite en quelques jours. Pour que le système apprenne à reconnaître ses intentions vocales, la patiente a dû s’entraîner pendant des semaines à « dire » silencieusement des phrases complètes – choisies dans un lexique de 1 024 mots.
À chaque tentative mentale, son implant captait les signaux envoyés par son cortex moteur, cette région du cerveau qui active normalement les muscles de la parole. Ces données étaient ensuite traitées par un double modèle : l’un convertissait les signaux en texte grâce au deep learning, l’autre les traduisait en voix synthétique.
C’est cette boucle qui permet aujourd’hui de la faire parler, elle qui ne peut ni bouger ni articuler. Même si le système reste encore un peu lent (47 mots/minute, soit un tiers de la vitesse d’une conversation normale), il fonctionne avec un décalage d’à peine une seconde entre la pensée et le son généré. Ce qui, il y a encore un an, prenait huit secondes à produire, se rapproche désormais du temps réel.

La parole, sans le timbre
Ce que l’on entend, forcément, ne ressemble pas encore à une voix humaine telle qu’on la connaît. L’intonation, la chaleur, les inflexions propres à chaque individu restent hors de portée, car ce n’est pas la bouche qui parle, mais une machine qui interprète.
À partir de l’activité électrique enregistrée par les électrodes, un réseau de neurones artificiels décode les sons probables, phonème par phonème, toutes les 80 millisecondes. Ces phonèmes sont ensuite agencés par un modèle de langage, qui prédit les mots et les phrases les plus probables, jusqu’à produire une version synthétique de ce que la personne a tenté de dire. Le tout est retransmis par haut-parleur ou casque audio.
Le système ne capte ni les pensées intimes, ni les émotions. Il ne fait que traduire l’intention motrice de parler – ce moment précis où le cerveau formule un ordre de parole que le corps, lui, ne peut plus exécuter.
Pour Sergey Stavisky, codirecteur du laboratoire de neuroprothèses à l’Université de Californie à Davis, cette réussite n'est qu'un début : « À terme, une neuroprothèse vocale devrait offrir toute la palette expressive de la voix humaine, permettant par exemple, de contrôler avec précision la hauteur et le rythme, et même de pouvoir chanter ».
Le domaine de la neuroprothèse attire désormais les entreprises privées, qui espèrent aller au-delà de la démonstration scientifique. La start-up Precision Neuroscience affirme capter des signaux cérébraux plus précis grâce à des électrodes plus denses. Elle a obtenu l’autorisation de laisser ses capteurs implantés jusqu’à trente jours, ce qui pourrait lui permettre de constituer, selon son PDG Michael Mager « la plus grande base de données de signaux neuronaux haute résolution existante sur Terre ». L’étape suivante, dit-il, consistera à miniaturiser l’ensemble, à rendre les implants biocompatibles et hermétiques, pour pouvoir les laisser en place à vie.
Ce que cette technologie rend possible n'est pas encore une voix pleine, riche et spontanée ; c'est une restitution fragmentaire, lente et dépendante d’un appareillage encore lourd. Toutefois, pour toutes celles et ceux qui vivent enfermés dans leur silence depuis des années, c’est un début. Une phrase qui passe, même artificielle, reste une phrase et entre ne rien pouvoir dire… et pouvoir arriver à prononcer un mot, il y a déjà un monde.
Nous ne sommes encore qu'aux balbutiements des neuroprothèses, comme l’étaient les premières jambes de bois ou les pinces articulées au début du XXᵉ siècle. À l’époque, elles servaient surtout à remplacer l’absence, pas à restaurer une fonction. Il a fallu un siècle pour passer d’un membre figé à une prothèse capable d’interagir avec les nerfs, d’anticiper le mouvement, de s’intégrer au corps. Les neuroprothèses d’aujourd’hui sont encore à ce stade primitif, mais elles existent !
Source : Ars Technica