Claude, le concurrent de ChatGPT, dévoile un nouveau modèle ultrarapide et qui hallucine moins

Publié le 13 août 2023 à 13h30

Claude Instant 1.2 est dévoilé ! Il est conçu dans le but de générer du texte très rapidement, de résoudre des problèmes mathématiques ou de s'attaquer à des domaines complexes comme la sécurité ou la programmation.

L'intelligence artificielle Claude a été créée par Anthropic, une start-up cofondée par d'anciens cadres de chez OpenAI. Elle a été pensée comme une concurrente à d'autres systèmes d'IA comme celui de ChatGPT ou de Google Bard, et sa toute nouvelle mise à jour va augmenter significativement ses performances. Claude Instant 1.2 progresse vite, très vite !

Un net bond en avant dans ses performances

Anthropic n'a pas chômé ces derniers mois, et Claude affiche des résultats en tests nettement supérieurs à la version précédente. Même si cette dernière était déjà plutôt impressionnante, surtout en ce qui concernait sa réactivité, le nouveau Claude a dépassé tous ses précédents records. Les gains sont significatifs, notamment en ce qui concerne la programmation et la résolution de problèmes mathématiques.

Lors d'un benchmark de programmation en langage Python, Claude 1.2 a réussi à atteindre un score de 58,7 %, tandis que l'ancienne version avait obtenu 52,8 %. Cela représente environ 11,8 % de progression. Pour la résolution de problèmes mathématiques, Claude 1.1 atteignait 80,9 %. Claude 1.2 le surpasse avec un joli score de 86,7 %, soit une amélioration de près de 7,12 %. Même si ces marges peuvent paraître petites, elles sont importantes à noter, car elles sont le témoin d'une sécurité renforcée ainsi que d'une réduction des erreurs possibles.

Plus précis et plus cohérent

Claude 1.2 ne se contente pas d'améliorer ses scores bruts dans les différents tests. Anthropic met également en avant sa précision accrue et sa cohérence améliorée dans les réponses qu'il donne. Les modèles d'IA génèrent parfois des informations fausses ou incohérentes. On les appelle couramment des « hallucinations », et les entreprises qui travaillent sur des modèles d'IA leur font la chasse.

L'entreprise a également travaillé à renforcer la résistance de Claude face aux tentatives de « jailbreak », ce qui représente un net avantage en matière de sécurité. Ainsi, les mesures de sécurité du modèle sont beaucoup plus difficiles à contourner, limitant les usages dangereux qui pourraient en être faits.

Progressivement, Claude 1.2 gagne du terrain dans le domaine des modèles d'IA générative. C'est clair et net, il est désormais un concurrent sérieux sur le marché de l'intelligence artificielle. Anthropic est en tout cas sur la bonne voie si elle continue de chouchouter son bébé de cette manière.