La start-up française, déjà reconnue pour ses modèles de langage, élargit son champ d'action et vise désormais l'automatisation documentaire.

© Mistral
© Mistral

Mistral AI, après avoir conquis le public avec son chatbot « Le Chat », dévoile une nouvelle corde à son arc : un outil de reconnaissance optique de caractères (OCR) promettant des performances de pointe.

Le chat Mistral
  • Peut tourner en local selon votre configuration
  • Open-source
  • API peu coûteuse

Une nouvelle étape pour Mistral AI

Fleuron de l'intelligence artificielle tricolore, Mistral AI continue son ascension. Après avoir fait sensation avec « Le Chat », son agent conversationnel qui a rapidement séduit un large public, comme en témoigne son million de téléchargements, la jeune pousse française s'attaque à un nouveau défi : la dématérialisation des documents. Ce mouvement s'inscrit dans une volonté plus large de l'entreprise de proposer une IA souveraine et performante, capable de rivaliser avec les géants du secteur, tout en répondant aux besoins spécifiques du marché francophone et européen.

Les entreprises cherchent constamment à optimiser leurs flux de travail et à gagner en efficacité. L'OCR, ou reconnaissance optique de caractères, est une technologie clé dans ce processus, permettant de convertir des documents papier ou des images en données numériques exploitables. L'arrivée d'un acteur comme Mistral AI sur ce marché pourrait bien redistribuer les cartes d'autant que la jeune pousse propose son API à un pris attractif (un dollars pour 1000 à 2000 documents !).

Extraction d'images et de tableaux avec Mistral OCR. © Mistral

Au-delà de la simple extraction de texte, l'outil serait capable d'identifier les différents éléments d'un document, tels que les titres, les paragraphes, les tableaux ou encore les listes. Cette compréhension avancée permettrait une conversion plus fidèle et plus pertinente des documents numérisés, ouvrant la voie à une automatisation plus poussée du traitement de l'information.

Mistral met en avant la conversion des documents PDF en fichiers Markdown. Ce format, de plus en plus populaire notamment dans le domaine du développement web et de la documentation technique, facilite l'édition et la manipulation du texte. Cette fonctionnalité pourrait s'avérer particulièrement utile pour les entreprises souhaitant intégrer rapidement et efficacement des informations issues de documents numérisés dans leurs systèmes d'information ou leurs flux de travail existants.

Source : Mistral