Le mois dernier, les ingénieurs de Microsoft affirmaient avoir le dispositif de reconnaissance vocale le plus performant du marché avec un taux d'erreur particulièrement bas. Au fil des années, les grandes sociétés high tech ont fait en sorte d'améliorer leurs algorithme et la firme de Redmond se place à présent loin devant la concurrence.
Amazon, Google, Apple, ou encore IBM travaillent sur la reconnaissance vocale depuis plusieurs années. Alors qu'il y a une vingtaine d'années, 57% des commandes vocales étaient correctement interprétées par les serveurs d'IBM, En 2004, ce chiffre était passé à près de 75%. Puis le taux d'erreur a baissé à 8% puis à 6,9%.
En septembre dernier, Microsoft revendiquait un taux d'erreur de 6,3%. La firme de Redmond fait usage de réseaux de neurones artificiels avec des dispositifs de machine learning aux sein desquels les algorithmes sont capables d'apprendre d'eux-mêmes.
Quelques semaines plus tard, Microsoft affirme avoir franchi un cap historique : son dispositif de reconnaissance vocale serait désormais aussi performant que la compréhension d'un être humain avec un taux d'erreur de 5,9%.
Cela signifie donc que la reconnaissance vocale est en mesure de comprendre le sens exact d'un mot dans son contexte même s'il existe des homonymes ou encore d'interpréter correctement des acronymes. Les fruits de ces travaux devraient ensuite être implémentés au sein de l'assistant vocal Cortana.
Bon, on imagine tout de même que les tests réalisés sont en anglais, il faudra probablement encore quelques années pour obtenir ces mêmes résultats en français...
Voir aussi : Deep learning : quand l'intelligence artificielle tente d'imiter le cerveau humain