Le spécialiste français de l’intelligence artificielle générative, Mistral AI, valorisé à 6 milliards de dollars, dévoile son nouveau modèle OCR (Optical Character Recognition). Cette innovation promet de transformer la gestion documentaire des entreprises en facilitant l’extraction et l’organisation des données issues de fichiers non structurés.
Bien que l’OCR existe depuis les années 1950, Mistral AI y apporte une nouvelle dimension grâce à son modèle performant. Cette technologie permet de convertir des documents sous forme d’images ou de PDF en données exploitables, rendant la recherche et l’analyse plus efficaces. Aujourd’hui, environ 90 % des informations organisationnelles mondiales sont stockées sous forme de documents, souligne Mistral, qui ambitionne d’optimiser leur utilisation grâce à Mistral OCR.
L’entreprise rappelle que l’histoire du progrès humain repose sur l’amélioration continue de l’accès à l’information : des hiéroglyphes aux manuscrits, de l’imprimerie à la numérisation. Avec cette nouvelle solution, Mistral AI entend franchir une nouvelle étape en rendant le savoir encore plus accessible et structuré.
Disponible via La Plateforme, l’espace dédié aux développeurs de Mistral, ainsi que par l’intermédiaire de ses partenaires cloud, Mistral OCR se distingue par ses performances supérieures aux solutions existantes, selon un benchmark interne. Il ne se contente pas d’extraire du texte, mais identifie aussi les illustrations et les photos au sein des documents, créant ainsi une structuration plus précise et complète.
Cette technologie pourrait jouer un rôle clé dans le développement de nouveaux modèles de langage (LLM), qui nécessitent des données organisées pour un entraînement efficace. En structurant et indexant les informations, Mistral OCR facilite l’exploitation de vastes bases documentaires par l’IA.
Guillaume Lample, cofondateur et directeur scientifique de Mistral, souligne que cette avancée représente « une étape cruciale pour l’intégration des assistants d’IA dans les entreprises », en simplifiant l’accès aux données internes.
L’outil offre plusieurs avantages notamment l’automatisation du traitement documentaire, réduisant les tâches administratives manuelles, analyse rapide des rapports, contrats et documents financiers, comparaison intelligente de contenus entre plusieurs fichiers, interaction intuitive avec les documents via des commandes textuelles, améliorant ainsi l’expérience utilisateur.
En structurant efficacement les données, Mistral OCR s’impose comme un levier de productivité pour les entreprises et un atout majeur pour le développement des intelligences artificielles de demain.