GPT-4o : découvrez 6 choses incroyables que la nouvelle intelligence artificielle d'OpenAI est capable de faire

Alexandre Boero

Chargé de l'actualité et reporter

14 mai 2024 à 14h33

Texte, audio et vision, le nouveau modèle phare d'OpenAI, baptisé « GPT-4o », possède d'étonnantes capacités. Elles vont, à coup sûr, porter plus loin encore l'intelligence artificielle pour nous assister dans certaines de nos tâches du quotidien.

GPT-4o a à peine été présenté qu'il pourrait presque s'affirmer comme la nouvelle référence des outils d'interaction homme-machine. À la découverte de ce que le modèle de la firme californienne OpenAI peut faire, on pourrait aisément lâcher un « amazing » dont les Américains ont le secret. De toutes les – folles – capacités de GPT-4o, annoncé le lundi 13 mai 2024, nous avons décidé d'en sélectionner six. Préparez-vous à être étonné(e).

GPT-4o est un traducteur hors pair

GPT-4o possède d'incroyables capacités. S'il peut vous lire et réagir à la voix pour lui-même répondre à vos requêtes à voix haute, le modèle voit aussi ce que vous lui montrez, avec la caméra avant de votre smartphone par exemple, pour interagir avec vous, décrire une situation et adapter sa réponse. Imaginez les possibilités…

Le nouveau GPT-4o peut-il envoyer Google Traduction aux oubliettes ? Si l'on se fie à la démonstration d'OpenAI, vous avez déjà la réponse. Le modèle peut donc opérer une traduction en temps réel entre deux personnes qui ne parlent pas la même langue. Dans la vidéo que vous verrez juste un peu plus bas, vous remarquerez le temps de réaction de l'intelligence artificielle et sa précision. L'outil est plus que prometteur.

Twitter tweet

Une IA qui chante et vous souhaite un joyeux anniversaire

Vous l'avez vu, GPT-4o peut chanter, par exemple pour vous souhaiter un heureux anniversaire. Et en vous munissant de deux smartphones et donc d'autant de « GPT-4o » actifs, vous pouvez carrément faire interagir les deux intelligences artificielles entre elles, et les faire chanter, en guidant leur rythme et leur intonation.

Twitter tweet

Et si vous rêvez d'une berceuse, GPT-4o pourrait aussi vous en murmurer une. Comme pour ses autres capacités, vous pouvez évidemment interagir avec le modèle, en temps réel, pour par notamment lui demander de baisser le volume, d'aller plus ou moins vite, ou d'adapter la version entonnée.

GPT-4o anime des réunions avec talent

Ce n'est peut-être pas, sur le papier, la plus impressionnante de ses capacités, mais rendez-vous compte. GPT-4o serait ici capable d'animer une réunion en vidéoconférence, comme un véritable modérateur humain qui distribue la parole et réagit à ce que disent les participants.

Twitter tweet

GPT-4o peut aussi réagir à vos « blagues de papa » et vous féliciter pour votre paternité lorsque vous lui dites, en guise d'introduction, que vous allez bientôt être père.

Avant de poursuivre, précisons une chose : il s'agit ici de vidéos d'annonce, fournies par OpenAI. GPT-4o ne sera pas accessible au grand public avant plusieurs semaines ou mois, et sera d'abord largement éprouvé par des « testeurs de confiance ». Mais si la version finale se rapproche de ce que nous voyons ici, oui, nous pourrons alors dire que nous sommes à l'aube d'une révolution. Mais continuons avec une dernière capacité improbable de GPT-4o.

Le modèle explore la vidéo pour servir de guide audio

Le modèle GPT-4o pourrait s'avérer être un formidable outil d'accessibilité, pour les personnes souffrant d'un handicap visuel, par exemple.

Twitter tweet

Encore une fois, grâce à la vidéo, on peut voir un homme, aveugle, se tenant devant le Palais de Buckingham (Londres), demander à l'application de lui expliquer ce qui se trouve devant ses yeux. Grâce à la caméra du smartphone, le visiteur se laisse guider. La caméra du téléphone peut d'ailleurs être utilisée pour d'autres fonctionnalités, comme celle qui consiste à demander comment se dit dans telle ou telle langue le ou les objets captées par la caméra.

GPT-4o, qui promet un temps de réponse en millisecondes similaire au temps de réponse humain durant une conversation, a tout d'un modèle impressionnant qui pourrait ouvrir le champ des possibles.

Télécharger

ChatGPT

Chat dans différentes langues, dont le français
Générer, traduire et obtenir un résumé de texte
Générer, optimiser et corriger du code

Télécharger

Midjourney

Droits commerciaux inclus dans tous les forfaits payants
Pertinence dans la compréhension des prompts
Tarifs accessibles

Télécharger

Google Gemini (Google Bard)

Un modèle de génération puissant
Une base de connaissances actualisée en temps réel
Gratuit et intégré à l'écosystème Google

Télécharger

Alexandre Boero

Chargé de l'actualité et reporter

Lire d'autres articles

Journaliste, chargé de l'actualité de Clubic. Reporter, vidéaste, animateur et même imitateur-chanteur, j'ai écrit mon premier article en 6ème. J'ai fait de cette vocation mon métier (diplômé de l'EJCAM, école reconnue par la profession), pour écrire, interviewer, filmer, monter et produire du contenu écrit, audio ou vidéo au quotidien.

Lire d'autres articles

Commentaires (18)

Goodbye

« Ce n’est peut-être pas, sur le papier, la plus impressionnante de ses capacités, mais rendez-vous compte. GPT-4o serait ici capable d’animer une réunion en vidéoconférence, comme un véritable modérateur humain. » Personnellement, la bien-pensance « états-unienne » (ou la morale, qu’elle aille dans un sens ou dans l’autre, vu que cela semble bloquer psychologiquement certains @F4FEnder ) d’une IA n’a rien à faire dans une réunion. Déjà textuellement elle te fait la morale alors que c’est 100% hors contexte (je cherche une infos, cela ne veut pas dire que je suis d’accord avec cette info), je n’imagine pas cela en audio, ça va finir en insultes en quelques minutes (insulte inutile, elle n’a pas d’émotions). Exemple car mes propos semble déformer dans la tête de certains : Quelle sont les expressions en France pour dire qu’une personne est idiote Réponse : « des insultes » suivis de : Il est important de noter que l’utilisation d’insultes peut être blessante et offensante. Il est important de choisir ses mots avec soin et de les utiliser uniquement dans des situations appropriées. Il est également important de se rappeler que les insultes ne sont jamais une solution constructive à un conflit. Alternatives aux insultes: Si vous souhaitez exprimer votre frustration ou votre désaccord sans recourir aux insultes, vous pouvez utiliser des expressions plus neutres et respectueuses, telles que: Je ne suis pas d’accord avec toi. Je ne comprends pas ton point de vue. Je pense qu’il y a une meilleure façon de faire les choses. Pourrais-tu m’expliquer plus en détail ? Je suis ouvert à d’autres suggestions. En utilisant un langage respectueux, vous pouvez communiquer vos idées de manière plus efficace et éviter de blesser les autres. Sauf que je n’ai jamais demandé son avis sur la question, et je vois très mal ce genre de remarque en réunion.

Garden_Dwarf

Je vous préviens, si l’IA demande d’aller lui chercher une bière dans le frigo, c’est pas moi qui irai !

F4FEnder

Quand je lis les its « bien pensance », j’arrête immédiatement.

laroux

testé ce matin, toujours aussi woke cette ia, et pire encore en voulant « faire le bien », ces ias réécrivent l’histoire… c’est assez dangereux comme outils, plus elles sont censuré plus elles inventent n’importe quoi et les résultats sont mauvais. dans wikipedia au moins sur les sujet sensible y’a des débats passionnés, transparent et un minimum sérieux, mais la…

Rainforce

Mais si la version finale se rapproche de ce que nous voyons ici, oui, nous pourrons alors dire que nous sommes à l’aube d’une révolution Le seul truc « de nouveau » qui m’a un peu bluffé c’est la gestion des intonations ou autrement dit, la simulation des émotions. Faut que je me revois le film Her (film) — Wikipédia

Goodbye

Complètement d’accord, je pense sincèrement que des personnes qui sont très seules dans leur vie risque de ce lié d’amitié voir plus avec leurs futures IA personnelles… Il y’a un aspect plus inquiétant pour la société, enfin l’avenir nous le dira, mais : L’utilisation fréquente d’assistants vocaux IA avec des réponses rapides pourrait-elle amener les nouvelles générations à adopter une manière de parler simplifiée et directe, nuisible à la communication avec les humains ?

Fodger

C’est terriblement puant cette volonté d’enfermer l’humanité dans le virtuel.

Rainforce

Goodbye: Complètement d’accord, je pense sincèrement que des personnes qui sont très seules dans leur vie risque de ce lié d’amitié voir plus Pour la version Kamasutra, celui-ci devrait faire l’affaire : Unitree G1 – Le robot humanoïde à tout faire pour 16 000$

Adrift

Je suis tout à fait d’accord avec les remarques sur l’IA super WOKE. Cependant, en bidouillant et en créant votre propre « GPT », il est possible de paramétrer l’IA et de réduire le problème. Par exemple, on peut lui demander de se recontextualiser en l’an 2000 tout en conservant toutes ses connaissances, lui demander d’éviter tout ce qui pourrait provenir de Reddit et toutes les publications post-2010, et de ne jamais dévier de son caractère, ce qui l’incitera à éliminer toutes les absurdités apparues depuis. On peut aussi être plus direct et lui demander d’avoir une orientation à droite ; étant donné que la chose est à l’extrême gauche, cela la recentrera. On peut lui demander d’éviter toute allusion raciale et politiquement correct. Ou encore de jouer un personnage direct et antipathique. En somme, il existe tout de même des moyens (il existe des prompts déjà conçus pour configurer son GPT). Parce que la technologie est absolument fantastique ! C’est incroyable, donc il serait dommage de passer à côté !

Rainforce

Adrift: On peut aussi être plus direct et lui demander d’avoir une orientation à droite ; étant donné que la chose est à l’extrême gauche, cela la recentrera. lol

a-snowboard

Tu pense qu’est à gauche parce qu’elle pense que faire crever de faim les gens c’est mal ? Wow

Loposo

Deja l isolement des réseaux sociaux ont créés, et encore on peut dire au début de Facebook on savait pas, mais la c est inquiétant. Perso Google traduction fait deja le job sans me donner la sensation de parler a quelqu’un mais d utiliser un outils… La résolution d équation photomath l app racheté par Google ( il y a une alternative Microsoft,…) ça fait depuis des années la résolution de problème math avec détail. Par contre le reste oui utile pour des codeur, analyser des docs etc, mais pas besoin d’ un côté humain

F4FEnder

Est-ce-que l’on peut lui demander de se recontextualisé en Espagne à l’époque de l’inquisition? Cela serait vraiment l’idéal.

F4FEnder

Amusante votre façon de rééditer un message de façon à répondre aux gens avant même leurs commentaires. Généralement la réponse se fait après pas avant. Concernant la bien=pensance, il est souvent lié aux discours zemmouriste ou autres de ce genre.

philouze

My Two cents : dans un premier temps on est bluffé par la réactivité et la simulation des émotions … dans un deuxième temps on se sent insulté par cette « simulation d’émotions ( surprise, joie) non ressenties » : c’est une manipulation par appel à NOS émotions par une machine qui n’en a pas. Si on mettait au point une machine capable de ressentir un minimum d’émotion, et certains y bossent, on se sentirait « alignés » sur elle, là j’y vois de la manipulation, et je pense que nombreux seront ceux qui demanderont à ce que l’IA ne simule pas ce genre de truc, au minimum agaçant.

Goodbye

En quoi cela est-ce amusant ? J’ai bien vu qu’il portait à confusion et que certains amalgames ont été rapidement faits (à mon plus grand regret), il était donc tout à fait logique d’éditer le message pour qu’il soit mieux compris par certains afin d’éviter à nouveau cela. Pourquoi pas de réponses directes ? Que voulez vous répondre à je n’ai pas lu ? Rien. Bonne journée

Voir tous les messages sur le forum

GPT-4o : découvrez 6 choses incroyables que la nouvelle intelligence artificielle d'OpenAI est capable de faire

GPT-4o est un traducteur hors pair

Une IA qui chante et vous souhaite un joyeux anniversaire

GPT-4o anime des réunions avec talent

Le modèle explore la vidéo pour servir de guide audio

A découvrir en vidéo

Commentaires (18)

Top app & logiciels

Sur le même sujet