À l’occasion de la GTC 2021, NVIDIA a fait de nombreuses annonces, dont beaucoup relatives à l’intelligence artificielle et à la création d’avatars.
Pour illustrer ses avancées en la matière, l’entreprise n’a d’ailleurs pas hésité à mettre en scène un avatar de son propre P.-D.G., Jensen Huang.
Lunettes noires et veste en cuir, c’est bien Toy Jensen
Si vous suivez régulièrement les allocutions de Jensen Huang, vous n’aurez aucune difficulté à le reconnaître dans sa version virtuelle dans la vidéo ci-dessous : lunettes noires, veste en cuir ; la copie est conforme au modèle. Et si son avatar invite ses trois interlocutrices à lui poser toutes les questions qu’elles souhaitent, c’est pour illustrer ses capacités à aborder divers sujets.
En effet, cette séquence sert notamment à promouvoir Omniverse Avatar, une plateforme qui condense le savoir-faire de NVIDIA « en matière d'IA vocale, de vision par ordinateur, de compréhension du langage naturel, de moteurs de recommandation et de technologies de simulation » pour façonner « des personnages interactifs dotés de graphismes 3D en ray-tracing, capables de voir, de parler, de converser sur une large gamme de sujets et de comprendre les intentions exprimées ».
Elle met également en avant NVIDIA Riva Speech AI, un outil permettant de « créer des voix humaines personnalisées en une journée, grâce à seulement 30 minutes de données audio ». NVIDIA Speech AI comprend également le logiciel NVIDIA Riva Custom Voice, qui autorise la création d’un assistant virtuel avec une voix unique. En pratique, ce logiciel peut servir à des entreprises ou à des centres d'appels souhaitant par exemple « développer une voix de marque reconnaissable pour servir les clients » ou « aider les personnes ayant des déficiences de la parole et du langage ».
Projects Maxine et Tokkio
NVIDIA Omniverse Avatar sert également aux projets Maxine et Tokkio. La démo du premier montre un avatar réalisé à partir d’une photo ; il énonce et traduit du texte dans plusieurs langues grâce à NVIDIA Riva. Celle du second montre un personnage entièrement virtuel capable de prendre les commandes de deux clients dans un restaurant.
Volontairement plus ou moins réalistes, tous ces avatars servent de vitrine à NVIDIA et préfigurent des assistants virtuels en 3D un peu plus ludiques et personnifiés que ne l’est une voix désincarnée.
Source : NVIDIA (1), NVIDIA (2)