Définition

OCR (Reconnaissance Optique de Caractères)

Technologie qui convertit des images de texte (documents scannés, photos) en texte éditable par la machine.

Publié le 4 mars 2026par ZoneIA

L’OCR transforme une image contenant du texte en caractères exploitables (copier-coller, recherche, extraction). On l’utilise sur des documents scannés, des photos prises au smartphone ou des captures d’écran. Contrairement à une simple “lecture d’image”, le résultat est du texte structuré que les logiciels peuvent indexer, analyser ou stocker.

Comment ça fonctionne

Un pipeline classique comprend :

Prétraitement : correction d’inclinaison, réduction du bruit, amélioration du contraste, binarisation.
Détection des zones de texte : repérage des lignes et blocs (mise en page, colonnes).
Reconnaissance : conversion des pixels en caractères via des modèles statistiques ou des réseaux de neurones (souvent CNN/Transformers).
Post-traitement : correction orthographique, dictionnaires métier, reconstruction de la mise en page, sortie en TXT/JSON/PDF “recherchable”.

La performance dépend fortement de la qualité d’image, des polices, de la langue, et des artefacts (ombres, flou).

Usages concrets

Numérisation et indexation d’archives (PDF recherchables).
Extraction de champs (factures, formulaires) pour automatiser la saisie.
Accessibilité (lecture d’écrans, sous-titres).
Analyse IA en aval : classification, résumé, RAG sur documents.

Exemples

Reconnaître un numéro de facture, extraire des montants, ou convertir une photo de tableau en texte modifiable.

Retour au glossaire

Continuez votre exploration

Outils IADécouvrir les outils

Prompts IAExplorer les prompts

Blog IALire nos articles