NVIDIA muscle son chatbot expérimental ChatRTX en lui greffant de nouveaux modèles d'intelligence artificielle. Celui-ci voit ainsi son arsenal s'étoffer et ses capacités évoluer considérablement.
Présenté en février dernier sous le nom de « Chat with RTX», ChatRTX n'était initialement qu'une application de démonstration. Concrètement, l'application crée un serveur de chatbot local accessible depuis votre navigateur. Celui-ci vous permet ainsi d'alimenter l'IA avec vos documents et même des vidéos YouTube, transformant votre machine en un puissant outil de recherche capable de résumer vos contenus et de répondre à vos questions.
Un assistant personnel survitaminé, mais toujours un peu lourd
Au niveau de la configuration minimale pour profiter de ChatRTX, pas de changement à l'horizon. Pour en profiter, il vous faudra posséder une carte graphique RTX série 30 ou 40 disposant d'au moins 8 Go de VRAM.
Initialement capable d'exploiter les modèles Mistral et Llama 2, ChatRTX peut désormais compter sur de nouveaux modèles : ChatGLM3 (modèle de langage bilingue anglais et chinois), CLIP d'OpenAI (capable de générer des descriptions de texte à partir d'images, et inversement) et Gemma de Google. Ce dernier a d'ailleurs été conçu spécialement en collaboration avec NVIDIA et fonctionne à merveille sur des PC solidement équipés.
ChatRTX centralise donc tous ces nouveaux modèles et se charge de simplifier leur exécution locale. L'interface apparaît comme plutôt intuitive et il est possible de jongler entre différents modules en fonction de vos besoins : analyse de vos photos, de vidéos en ligne ou synthèses de documents par exemple.
Pour l'utiliser, il suffit de se rendre sur le site officiel de NVIDIA et d'être un peu patient. En effet, ChatRTX demande pas moins de 36 Go d'espace libre pour être installé !
La voix, prochaine interface avec l'IA ?
On imagine bien que les résultats sont plus convaincants que la première démo, ou ChatRTX peinait un peu à exécuter certaines tâches qu'on lui demandait. NVIDIA ne s'est pas contenté d'améliorer sa prise en charge des modèles, mais l'a également doté d'un système de reconnaissance vocale. Comment ? En intégrant Whisper, un modèle d'IA conçu par OpenAI, spécialement taillé pour la reconnaissance et la transcription vocales.
Ainsi, l'utilisateur pourra interroger ChatRTX, juste à l'aide de sa voix. Serait-ce donc le nouveau cap qui se profile pour les chatbots ? S'affranchir de la nécessité du clavier et d'écouter simplement pour répondre aux questions ? Difficile à dire, mais il est possible que cette initiative oriente l'industrie de l'IA dans cette direction.
Source : The Verge