GPT-4o : découvrez 6 choses incroyables que la nouvelle intelligence artificielle d'OpenAI est capable de faire

Par Alexandre Boero, Journaliste-reporter, responsable de l'actu.

Publié le 14 mai 2024 à 14h33

Texte, audio et vision, le nouveau modèle phare d'OpenAI, baptisé « GPT-4o », possède d'étonnantes capacités. Elles vont, à coup sûr, porter plus loin encore l'intelligence artificielle pour nous assister dans certaines de nos tâches du quotidien.

GPT-4o a à peine été présenté qu'il pourrait presque s'affirmer comme la nouvelle référence des outils d'interaction homme-machine. À la découverte de ce que le modèle de la firme californienne OpenAI peut faire, on pourrait aisément lâcher un « amazing » dont les Américains ont le secret. De toutes les – folles – capacités de GPT-4o, annoncé le lundi 13 mai 2024, nous avons décidé d'en sélectionner six. Préparez-vous à être étonné(e).

GPT-4o est un traducteur hors pair

GPT-4o possède d'incroyables capacités. S'il peut vous lire et réagir à la voix pour lui-même répondre à vos requêtes à voix haute, le modèle voit aussi ce que vous lui montrez, avec la caméra avant de votre smartphone par exemple, pour interagir avec vous, décrire une situation et adapter sa réponse. Imaginez les possibilités…

Le nouveau GPT-4o peut-il envoyer Google Traduction aux oubliettes ? Si l'on se fie à la démonstration d'OpenAI, vous avez déjà la réponse. Le modèle peut donc opérer une traduction en temps réel entre deux personnes qui ne parlent pas la même langue. Dans la vidéo que vous verrez juste un peu plus bas, vous remarquerez le temps de réaction de l'intelligence artificielle et sa précision. L'outil est plus que prometteur.

...

Une IA qui chante et vous souhaite un joyeux anniversaire

Vous l'avez vu, GPT-4o peut chanter, par exemple pour vous souhaiter un heureux anniversaire. Et en vous munissant de deux smartphones et donc d'autant de « GPT-4o » actifs, vous pouvez carrément faire interagir les deux intelligences artificielles entre elles, et les faire chanter, en guidant leur rythme et leur intonation.

...

Et si vous rêvez d'une berceuse, GPT-4o pourrait aussi vous en murmurer une. Comme pour ses autres capacités, vous pouvez évidemment interagir avec le modèle, en temps réel, pour par notamment lui demander de baisser le volume, d'aller plus ou moins vite, ou d'adapter la version entonnée.

GPT-4o anime des réunions avec talent

Ce n'est peut-être pas, sur le papier, la plus impressionnante de ses capacités, mais rendez-vous compte. GPT-4o serait ici capable d'animer une réunion en vidéoconférence, comme un véritable modérateur humain qui distribue la parole et réagit à ce que disent les participants.

...

GPT-4o peut aussi réagir à vos « blagues de papa » et vous féliciter pour votre paternité lorsque vous lui dites, en guise d'introduction, que vous allez bientôt être père.

Avant de poursuivre, précisons une chose : il s'agit ici de vidéos d'annonce, fournies par OpenAI. GPT-4o ne sera pas accessible au grand public avant plusieurs semaines ou mois, et sera d'abord largement éprouvé par des « testeurs de confiance ». Mais si la version finale se rapproche de ce que nous voyons ici, oui, nous pourrons alors dire que nous sommes à l'aube d'une révolution. Mais continuons avec une dernière capacité improbable de GPT-4o.

Le modèle explore la vidéo pour servir de guide audio

Le modèle GPT-4o pourrait s'avérer être un formidable outil d'accessibilité, pour les personnes souffrant d'un handicap visuel, par exemple.

...

Encore une fois, grâce à la vidéo, on peut voir un homme, aveugle, se tenant devant le Palais de Buckingham (Londres), demander à l'application de lui expliquer ce qui se trouve devant ses yeux. Grâce à la caméra du smartphone, le visiteur se laisse guider. La caméra du téléphone peut d'ailleurs être utilisée pour d'autres fonctionnalités, comme celle qui consiste à demander comment se dit dans telle ou telle langue le ou les objets captées par la caméra.

GPT-4o, qui promet un temps de réponse en millisecondes similaire au temps de réponse humain durant une conversation, a tout d'un modèle impressionnant qui pourrait ouvrir le champ des possibles.

ChatGPT

Chat dans différentes langues, dont le français
Générer, traduire et obtenir un résumé de texte
Générer, optimiser et corriger du code

Télécharger

10 /10

Midjourney

Droits commerciaux inclus dans tous les forfaits payants
Pertinence dans la compréhension des prompts
Tarifs accessibles

Télécharger

9 /10

Google Gemini (Bard)

Un modèle de génération puissant
Une base de connaissances actualisée en temps réel
Gratuit et intégré à l'écosystème Google

Télécharger

8 /10

Par Alexandre Boero

Journaliste-reporter, responsable de l'actu

Journaliste, responsable de l'actualité de Clubic – Sensible à la cybersécurité, aux télécoms, à l'IA, à l'économie de la Tech, aux réseaux sociaux ou encore aux services en ligne. En soutien direct du rédacteur en chef, je suis aussi le reporter et le vidéaste de la bande. Journaliste de formation, j'ai fait mes gammes à l'EJCAM, école reconnue par la profession, où j'ai bouclé mon Master avec une mention « Bien » et un mémoire sur les médias en poche.

Articles d'Alexandre Boero

OpenAI

Intelligence artificielle

Actualités High-Tech

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Rejoignez la communauté Clubic

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

Commentaires (10)

Garden_Dwarf

Je vous préviens, si l’IA demande d’aller lui chercher une bière dans le frigo, c’est pas moi qui irai !

F4FEnder

Quand je lis les its « bien pensance », j’arrête immédiatement.

laroux

testé ce matin, toujours aussi woke cette ia, et pire encore en voulant « faire le bien », ces ias réécrivent l’histoire…
c’est assez dangereux comme outils, plus elles sont censuré plus elles inventent n’importe quoi et les résultats sont mauvais.

dans wikipedia au moins sur les sujet sensible y’a des débats passionnés, transparent et un minimum sérieux, mais la…

Rainforce

Mais si la version finale se rapproche de ce que nous voyons ici, oui, nous pourrons alors dire que nous sommes à l’aube d’une révolution

Le seul truc « de nouveau » qui m’a un peu bluffé c’est la gestion des intonations ou autrement dit, la simulation des émotions.

Faut que je me revois le film Her (film) — Wikipédia

Fodger

C’est terriblement puant cette volonté d’enfermer l’humanité dans le virtuel.

Rainforce

Pour la version Kamasutra, celui-ci devrait faire l’affaire : Unitree G1 – Le robot humanoïde à tout faire pour 16 000$

Adrift

Je suis tout à fait d’accord avec les remarques sur l’IA super WOKE.

Cependant, en bidouillant et en créant votre propre « GPT », il est possible de paramétrer l’IA et de réduire le problème. Par exemple, on peut lui demander de se recontextualiser en l’an 2000 tout en conservant toutes ses connaissances, lui demander d’éviter tout ce qui pourrait provenir de Reddit et toutes les publications post-2010, et de ne jamais dévier de son caractère, ce qui l’incitera à éliminer toutes les absurdités apparues depuis.

On peut aussi être plus direct et lui demander d’avoir une orientation à droite ; étant donné que la chose est à l’extrême gauche, cela la recentrera. On peut lui demander d’éviter toute allusion raciale et politiquement correct. Ou encore de jouer un personnage direct et antipathique. En somme, il existe tout de même des moyens (il existe des prompts déjà conçus pour configurer son GPT).

Parce que la technologie est absolument fantastique ! C’est incroyable, donc il serait dommage de passer à côté !

Rainforce

lol

a-snowboard

Tu pense qu’est à gauche parce qu’elle pense que faire crever de faim les gens c’est mal ?
Wow

Loposo

Deja l isolement des réseaux sociaux ont créés, et encore on peut dire au début de Facebook on savait pas, mais la c est inquiétant.
Perso Google traduction fait deja le job sans me donner la sensation de parler a quelqu’un mais d utiliser un outils…
La résolution d équation photomath l app racheté par Google ( il y a une alternative Microsoft,…) ça fait depuis des années la résolution de problème math avec détail.
Par contre le reste oui utile pour des codeur, analyser des docs etc, mais pas besoin d’ un côté humain