Définition
OCR (Reconnaissance Optique de Caractères)
Technologie qui convertit des images de texte (documents scannés, photos) en texte éditable par la machine.
Publié le 4 mars 2026par ZoneIA
L’OCR transforme une image contenant du texte en caractères exploitables (copier-coller, recherche, extraction). On l’utilise sur des documents scannés, des photos prises au smartphone ou des captures d’écran. Contrairement à une simple “lecture d’image”, le résultat est du texte structuré que les logiciels peuvent indexer, analyser ou stocker.
Comment ça fonctionne
Un pipeline classique comprend :
- Prétraitement : correction d’inclinaison, réduction du bruit, amélioration du contraste, binarisation.
- Détection des zones de texte : repérage des lignes et blocs (mise en page, colonnes).
- Reconnaissance : conversion des pixels en caractères via des modèles statistiques ou des réseaux de neurones (souvent CNN/Transformers).
- Post-traitement : correction orthographique, dictionnaires métier, reconstruction de la mise en page, sortie en TXT/JSON/PDF “recherchable”.
La performance dépend fortement de la qualité d’image, des polices, de la langue, et des artefacts (ombres, flou).
Usages concrets
- Numérisation et indexation d’archives (PDF recherchables).
- Extraction de champs (factures, formulaires) pour automatiser la saisie.
- Accessibilité (lecture d’écrans, sous-titres).
- Analyse IA en aval : classification, résumé, RAG sur documents.
Exemples
Reconnaître un numéro de facture, extraire des montants, ou convertir une photo de tableau en texte modifiable.