Baptisée Rosetta, l'intelligence artificielle dévoilée par Facebook est en mesure d'analyser et d'extraire le texte d'images ou de vidéos issus du réseau social. De fait, elle pourrait permettre à Facebook d'éviter les contenus licencieux.
Comme elle l'a expliqué dans un billet partagé en ligne le 11 septembre, l'entreprise de Zuckerberg se tourne vers le déploiement d'une nouvelle intelligence chargée d'analyser le contenu de Facebook. Si la lutte aux fake news continue, l'usage de Rosetta ne se destine pourtant pas à cela.
Rosetta comprend une trentaine de langues
En effet, la plateforme sociale souhaite être en mesure d'analyser le texte contenu dans les images et les vidéos. Bien que de nombreux textes soient déjà des vecteurs de contenus inappropriés, c'est également le cas des images intégrant plusieurs mots ou phrases qui n'ont pourtant pas leur place sur la plateforme. À ce jour, l'intelligence artificielle est capable de déchiffrer le contenu textuel de plus d'un milliard d'images par jour en temps réel et en cinq langues différentes. Dans son billet, la compagnie indique avoir ajouté plus d'une vingtaine de nouvelles langues non latines, à l'exemple du pendjabi, du mongol ou de l'ourdou.Pour fonctionner, Rosetta se base sur un réseau neuronal à convolution qui lui permet de détecter les zones rectangulaires des images afin de savoir si elles contiennent des textes. Si c'est le cas, un OCR (reconnaissance optique de caractères) se charge ensuite de le transcrire. Quand le système réussit à décrypter le texte correctement, il change d'image, sinon, il réessaye jusqu'à parvenir au bon résultat.
Néanmoins, Facebook reconnaît que son système n'est pas encore parfaitement fonctionnel, en ce qu'il a encore du mal à faire son travail lorsqu'il s'agit de texte intégré à des vidéos à cause du nombre d'images par seconde. Néanmoins, le programme est déjà exploité sur les plateformes Facebook et Instagram.