Le géant américain vient de développer un nouveau système d'IA vocale, baptisé VALL-E 2. Une réussite telle que Microsoft… ne peut la partager !
Il y a des IA qui sont devenus extrêmement populaires du fait de leurs capacités, comme Gemini ou ChatGPT. Puis il y a les autres, celles qui ne sont pas seulement très performantes, mais aussi tellement dangereuses que son créateur ne souhaite finalement pas la rendre publique. C'est une possibilité que s'est notamment imposé Microsoft dès 2022 dans le domaine de la reconnaissance faciale, et qui explique pourquoi l'IA VALL-E 2 dont on apprend l'existence… ne sera pas mise sur le marché !
VALL-E 2 atteint la « parité humaine »
Microsoft n'est jamais avare de nouveautés en matière d'intelligence artificielle. Et la firme fondée par Bill Gates vient encore de récidiver, avec le développement d'une IA de synthétisation vocale, mentionnée dans un papier de recherche repéré par Live Science.
Baptisée VALL-E 2, il s'agirait d'une IA extraordinairement puissante, puisqu'elle aurait atteint la « parité humaine ». Cela signifie que cette IA, capable de convertir du contenu textuel en discours oral, produit des voix qui seraient dorénavant indistinctes de celles des êtres humains.
L'alerte « danger » résonne chez Microsoft
Il s'agit d'une amélioration du premier modèle du genre, VALL-E, présenté par Microsoft en janvier 2023, et qui était capable d'imiter n'importe quelle voix à partir d'un extrait d'à peine 3 secondes. À l'époque, même si le produit était déjà une prouesse, il affichait par contre dans le rendu quelques imperfections qui permettaient tout de même de repérer son caractère artificiel. Ce qui ne serait plus le cas aujourd'hui.
Évidemment, il faudra croire Microsoft sur parole quant aux performances de VALL-E 2, le géant ayant décidé, pour des raisons de sécurité, de ne pas le proposer au public. C'est en un sens dommage quand on sait que le géant américain affirme que « VALL-E 2 synthétise systématiquement une parole de haute qualité, même pour des phrases traditionnellement difficiles à prononcer en raison de leur complexité ou de leur caractère répétitif. »
Mais c'est aussi peut-être pour le mieux, quand on se rappelle des différentes escroqueries ayant utilisé les IA de synthétisation vocale pour voler de nombreuses personnes.
10 novembre 2024 à 19h08
Source : Mashable, Microsoft, Tom's Guide