ChatGPT a gagné une interface vocale sur iOS et Android © Corentin Béchade pour Clubic
ChatGPT a gagné une interface vocale sur iOS et Android © Corentin Béchade pour Clubic

C’est une annonce que l’on n’attendait pas. En plein milieu du feuilleton OpenAI, ChatGPT vient de gagner une nouvelle fonctionnalité : la discussion vocale. Voici comment l’utiliser.

OpenAI a beau traverser une crise majeure de leadership, ses employés ne manquent pas d’humour pour autant. Dans une courte vidéo publiée sur X (ex-Twitter), l’entreprise a annoncé que ChatGPT Voice, l’incarnation audio de son assistant personnel bien connu, était désormais accessible à tous et toutes. De quoi mettre Siri, Alexa et autre Google Assistant au placard ou presque.

Comment utiliser ChatGPT Voice ?

L’annonce faite sur le réseau de microblogging contient une petite blague quant à la situation actuelle de l’entreprise, puisque la voix qui interroge ChatGPT demande « la journée a été longue pour l’équipe […] combien de pizzas devrais-je commander pour 778 personnes ? ». Mais au-delà de la petite touche d’humour, la vidéo montre le fonctionnement extrêmement simple de cet assistant virtuel, qui parle en plus français avec une charmante pointe d’accent américain.

Pour lancer une discussion avec l’assistant, il faut obligatoirement passer par l’application sur iOS ou Android. La fonctionnalité ne semble pas encore disponible sur la version web de ChatGPT. Ensuite, rien de bien sorcier :

  • Assurez-vous que votre application est à jour
  • Lancez l’application ChatGPT
  • Cliquez sur le logo de casque en bas à droite de la fenêtre
  • Cliquez sur le bouton « Continue » dans la fenêtre qui s’ouvre
  • Choisissez la voix qui vous convient le mieux (elles sont en anglais, mais l’assistant parle français)
  • Autorisez l’application à accéder au micro de votre appareil
  • Formulez votre requête et attendez que l’assistant vous réponde
La marche à suivre pour utiliser ChatGPT Voice © Corentin Béchade pour Clubic
La marche à suivre pour utiliser ChatGPT Voice © Corentin Béchade pour Clubic

Un assistant virtuel très intelligent… mais limité

ChatGPT Voice fonctionne comme n’importe quel autre assistant virtuel. Il répondra à vos questions les plus banales, pourra vous générer du contenu à la volée ou tenir la discussion sur n’importe quel sujet. En somme, il est capable de faire tout ce que fait le ChatGPT classique, mais avec une voix serviable et rassurante. D’ailleurs, le contenu des conversations est immédiatement retranscrit dans l’interface texte de l’application afin de retrouver plus facilement les réponses générées par ChatGPT.

Tant que vous restez dans l’interface de saisie vocale, vous pouvez discuter avec ChatGPT sans avoir à recliquer sur le bouton à chaque fois. La conversation peut durer aussi longtemps que vous le souhaitez et l’assistant vocal garde en tête les sujets de conversation tout au long de l’échange. Vous pouvez ainsi lui demander de préciser sa pensée sur un certain sujet ou de reformuler certains détails de ses réponses.

La seule chose que l’assistant ne sait pas faire, comparée à Siri ou Google Assistant, c’est accéder aux données sur le téléphone ou à vos applications. Il sera donc incapable de régler un minuteur ou de lancer une vidéo YouTube depuis l’interface de ChatGPT.

Derrière l’outil de reconnaissance vocale et la voix de synthèse de ChatGPT se cache l’algorithme open source Whisper, développé en interne. Ce dernier a avalé 680 000 heures de discours en plusieurs langues afin de reconnaître au mieux les requêtes vocales en français, en anglais ou dans une quarantaine d’autres langues. L’algorithme est même capable de jongler entre les langues au sein d’une même requête vocale.

  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code
10 / 10

Source : X - OpenAI