Ce que fait vraiment Mistral OCR 4
L'OCR classique, vous connaissez. Vous scannez un bon de livraison, le logiciel reconnaît les lettres et vous donne du texte brut. Ensuite, quelqu'un dans vos équipes retranscrit les données dans votre ERP ou votre tableau Excel. Deux fois le même travail. Un risque d'erreur. Du temps perdu.
Mistral OCR 4 change la logique. Lancé le 23 juin 2026, le modèle ne retourne pas seulement du texte : il identifie et classe chaque bloc du document. Un titre reste un titre. Un tableau reste un tableau. Une signature est reconnue comme telle. Une liste de produits avec quantités et prix unitaires ressort en tableau structuré, pas en suite de caractères à interpréter.
Ce que vous obtenez en sortie : un JSON propre, directement exploitable par votre logiciel ou votre outil d'automatisation. Pas besoin d'une deuxième étape de traitement pour comprendre ce que le document voulait dire.
Le modèle ajoute aussi un score de confiance par mot et par page. Pratique pour détecter automatiquement les zones floues ou dégradées, et déclencher une vérification humaine uniquement là où c'est nécessaire, pas sur tout le document.
Formats acceptés : PDF, Word, PowerPoint, OpenDocument. 170 langues couvertes. Un seul appel API suffit pour obtenir le tout.
Quatre situations concrètes pour une PME en région Centre
Voilà ce que vos équipes font encore à la main aujourd'hui, et que ce modèle peut prendre en charge.
Factures fournisseurs au format PDF non structuré
Vos fournisseurs ne sont pas tous passés à la facturation électronique structurée. L'obligation d'émettre en Factur-X ou UBL ne s'applique aux PME qu'à partir du 1er septembre 2027. D'ici là, vous recevrez encore des PDF classiques pendant au moins un an. OCR 4 extrait le numéro de facture, les montants, la TVA, les lignes de détail, le SIRET fournisseur. Vous injectez ça directement dans votre comptabilité ou dans Odoo. La ressaisie disparaît.
Pour rappel : depuis le 1er septembre 2026, toutes les entreprises doivent être capables de recevoir des factures électroniques via une plateforme agréée. Le traitement de ces factures reçues, lui, reste à organiser. OCR 4 couvre le cas des PDF non encore structurés qui arrivent en parallèle. Voir aussi la page dédiée à la réforme facture électronique pour comprendre vos obligations exactes.
Bons de livraison et commandes fournisseurs
Un transporteur dépose un BL papier, votre magasinier le scanne. OCR 4 retrouve les références produits, les quantités, la date, le numéro de commande associé. Plus de saisie au retour en entrepôt. L'entrée en stock se fait automatiquement dès validation du rapprochement avec la commande.
Même logique pour les devis fournisseurs. Vous en recevez cinq pour comparer les prix sur une même référence. Extraire manuellement les lignes de chaque devis prend du temps. OCR 4 les aligne en quelques secondes dans un tableau comparatif.
Contrats et documents juridiques
Un bail commercial, un contrat de prestation de service, un avenant de renouvellement. OCR 4 extrait les dates, les montants, les parties, les clauses importantes. Vous alimentez un registre de contrats sans passer par un assistant qui lit chaque document une fois par trimestre. Et quand une échéance approche, votre outil d'automatisation vous avertit à l'avance.
Dossiers RH et documents de conformité
CV, certificats de formation, justificatifs de domicile, diplômes. Dans les PME qui recrutent régulièrement, traiter 30 dossiers à la main prend une demi-journée. OCR 4 extrait les informations dans un format exploitable en quelques minutes. Vous restez décideur sur qui vous recrutez. Vous gagnez le temps de lecture mécanique.
Sur ce type de données personnelles, l'hébergement sur site est fortement recommandé. On y revient en section suivante.
Ce que ça coûte, en chiffres réels
Les tarifs publics de Mistral au lancement d'OCR 4 :
- API standard : 4 dollars pour 1 000 pages, soit environ 0,37 centime la page HT
- API en batch (traitement différé de quelques heures) : 2 dollars pour 1 000 pages, environ 0,18 centime la page
- Hébergement sur site (self-hosted) : sur devis auprès de Mistral directement
Pour une PME du Loir-et-Cher (41) ou du Cher (18) qui traite 500 factures fournisseurs par mois, on arrive à moins de 2 euros par mois en mode batch. Moins que le café de la salle de pause. Beaucoup moins que le coût d'une saisie manuelle.
Ce coût réel de la saisie manuelle mérite d'être calculé une fois pour toutes. Si un collaborateur passe 20 minutes par jour à retranscrire des données de factures ou de bons de livraison, soit un quart de son temps sur une tâche sans valeur ajoutée, vous êtes déjà à plusieurs centaines d'euros par mois. La comparaison est rapide à faire.
Pour piloter votre diagnostic d'automatisation, je commence toujours par ce calcul avec le dirigeant. Combien de fois par semaine un document arrive, combien de temps votre équipe passe dessus, combien ça coûte. Souvent, les dirigeants sous-estiment ce chiffre d'un facteur deux.
RGPD et souveraineté : ce que l'option self-hosted change
La première question que me posent les dirigeants à Orléans ou à Tours avant de mettre un outil d'IA en production : "mes données partent où ?"
Mistral est une société française, basée à Paris, avec une infrastructure serveur en Europe. L'API passe par leurs serveurs, mais les données ne sont pas utilisées pour l'entraînement du modèle dans le cadre de leur offre commerciale, selon leur politique publiée. C'est déjà mieux que la plupart des alternatives américaines.
L'option self-hosted va plus loin : le modèle tourne entièrement sur votre propre infrastructure. Vos contrats, vos factures, vos documents RH ne quittent jamais votre réseau d'entreprise. Pour les PME qui traitent des données sensibles, celles de la santé, du juridique, de la RH, ou celles qui ont des clients qui l'exigent contractuellement, c'est la seule option sans compromis.
L'auto-hébergement suppose une capacité technique. Soit un serveur interne adapté, soit un cloud privé bien configuré. Ce n'est pas accessible à toutes les PME sans accompagnement. Si ce n'est pas votre cas aujourd'hui, l'API standard avec les engagements contractuels de Mistral reste solide pour la grande majorité des usages en PME du Loiret.
Je peux mettre en place l'extraction automatique dans votre SI en quelques jours. Factures fournisseurs, BL, contrats : on définit ensemble ce qui vaut le coup d'automatiser et on le fait.
Parlons-enComment l'intégrer dans votre flux : Odoo, n8n ou simple API
Mistral OCR 4 s'utilise via une API HTTP standard. Vous envoyez un fichier, vous recevez un JSON. C'est la brique de base. À partir de là, trois scénarios selon votre niveau d'équipement.
Vous utilisez n8n ou Make
Un noeud HTTP appelle l'API OCR 4 dès qu'un document arrive dans votre dossier partagé ou dans votre boîte mail. Le JSON retourné alimente un deuxième noeud qui crée automatiquement une écriture comptable dans votre logiciel, ouvre un ticket de réception en entrepôt ou alerte votre responsable achats. Zéro intervention humaine sur la partie extraction et routage.
Vous êtes sur Odoo
J'intègre ce type de flux directement dans Odoo pour des PME de Tours, de Blois et d'Orléans. Le principe : une facture PDF reçue par email déclenche automatiquement l'appel OCR 4, les champs extraits (montant HT, TVA, fournisseur, référence) alimentent un brouillon de pièce comptable dans Odoo que votre comptable valide en un clic. La ressaisie disparaît. La validation humaine reste. Voir la page Odoo pour comprendre comment j'intègre ces automatisations dans votre ERP.
Vous n'avez aucun outil d'automatisation en place
C'est souvent le cas des PME de 10 à 50 personnes qui n'ont pas de DSI et qui tournent encore sous Excel, Sage ou un logiciel de gestion vieillissant. Le bon point de départ : un échange d'une heure pour identifier les deux ou trois flux documentaires qui vous coûtent le plus de temps. On chiffre, on priorise, et on pose un premier flux simple. Pas besoin de tout refaire d'un coup.
Je travaille avec des PME du Centre-Val de Loire, Loiret (45), Loir-et-Cher (41), Indre-et-Loire (37), Cher (18). Le premier échange ne coûte rien.
Questions fréquentes
Faut-il des compétences en programmation pour utiliser Mistral OCR 4 ?
Pas pour tester. Mistral propose un accès via La Plateforme, leur portail en ligne, sans écrire une ligne de code. Pour une intégration dans un flux de production (email vers OCR vers ERP), il faut soit un développeur, soit un intégrateur qui configure n8n ou Make. C'est une mission de quelques jours, pas un projet de plusieurs mois.
OCR 4 fonctionne-t-il bien sur des factures françaises avec TVA, SIRET et adresses ?
Oui. Le modèle couvre 170 langues et comprend les structures françaises courantes. Les tableaux de TVA, les numéros de SIRET et les adresses françaises sont reconnus correctement dans les tests réalisés à ce jour. Le score de confiance par mot permet de signaler les zones à vérifier manuellement si un document est dégradé ou manuscrit en partie.
Puis-je utiliser OCR 4 pour traiter des factures Factur-X reçues à partir de septembre 2026 ?
Factur-X est un PDF avec un fichier XML structuré intégré. Pour ces factures, vous n'avez pas besoin d'OCR : vous lisez directement le XML avec votre logiciel ou votre plateforme agréée. Mistral OCR 4 reste très utile pour les fournisseurs qui n'auront pas encore basculé vers Factur-X avant septembre 2027, et ils seront nombreux dans la période de transition.
Quelle différence entre Mistral OCR 4 et Google Document AI ou Adobe Extract ?
Mistral OCR 4 est auto-hébergeable, ce que Google et Adobe ne permettent pas. Le prix est plus bas à volume comparable. Et Mistral est une société française soumise au droit européen, ce qui simplifie vos engagements RGPD vis-à-vis de vos clients. En termes de performance pure, Mistral revendique 72 % de préférence dans des comparatifs face aux solutions concurrentes (source : Mistral AI, juin 2026).
Prêt à arrêter de ressaisir vos documents ?
Un échange d'une heure, on identifie ensemble les deux flux qui vous font perdre le plus de temps. Je vous propose un chiffrage et on décide si ça vaut le coup de démarrer.