Vous avez toujours rêvé de faire dire n'importe quoi à vos personnages de jeux vidéo préférés (ou détestés) ? Le site 15.ai l'a fait !
L'initiative, ambitieuse, nous vient d'un étudiant au MIT, qui continue de développer son projet d'études en raison de sa popularité. Le site propose déjà de faire dire tout ce que vous voulez (à condition de ne pas être anglophobe) à une centaine de personnages tirés d'une vingtaine de jeux, dessins animés et autres séries. Voici un exemple parmi tant d'autres :
Une intelligence artificielle de pointe pour amuser la galerie
Pour fonctionner, le site utilise un système de « deep learning » permettant de retranscrire vocalement tout ce que l'utilisateur écrit. Une fois le texte généré, l'intelligence artificielle procède en temps réel à l'édition d'un fichier audio. Pour ce faire, son créateur a incorporé de nombreux algorithmes audio et des réseaux neuraux spécifiquement créés pour le bien du projet.
Non seulement la voix demandée pour retranscrire le texte est parfaitement juste, le système permet également d'en modifier le ton en fonction des émotions perçues dans le texte. Au travers de Deepmoji, un autre système « deep learning » d'analyse des sentiments, le texte rédigé se verra attribué les emoji pertinentes que l'on pourra retrouver dans l'enregistrement audio généré.
Selon son créateur, il s'agit à ce jour du système de retranscription d'un texte en audio le plus abouti jamais développé. Compte tenu de son succès, nul doute que le site continuera à évoluer et s'améliorer.
Un site devenu très populaire
Pour l'heure, le site ne permet une retranscription fidèle qu'en anglais. Ne vous attendez donc pas à faire dire correctement « Les chaussettes de l'archiduchesse sont-elles sèches ou archi-sèches ? » à Gordon Freeman d'Half-Life ou à Doctor Who.
Compte tenu de la forte popularité de son projet, le créateur du site 15.ai dispose d'une page Patreon pour l'aider à le développer et à financer la maintenance des serveurs. Ceux-ci connaissent d'ailleurs régulièrement un trafic intense, ralentissant le travail d'une intelligence artificielle surmenée. Il faudra donc parfois s'attendre à ce que le fichier audio demandé mette quelques secondes ou minutes à être généré.
Le site permet à des créateurs de contenu sur Twitter et YouTube d'intégrer ces retranscriptions, à condition bien sûr d'accorder les crédits nécessaires à la plateforme et son créateur. On peut donc retrouver sur ces réseaux de nombreux exemples de ce que peut donner le mélange entre un esprit créatif et une technologie aussi efficace que diablement amusante.
Source : 15.ai