Définition | Reconnaissance Optique de Caractères
C’est quoi ?
La Reconnaissance Optique de Caractères (OCR en anglais) est un procédé qui consiste à convertir les images de texte imprimé, dactylographié ou manuscrit en données modifiables et consultables. L’OCR fait généralement partie des fonctions et caractéristiques essentielles d’un logiciel qui effectue une analyse d’un fichier image (PDF, .jpg, .png, etc., par exemple) et qui convertit les caractères dans un fichier texte (Microsoft Word, Excel, etc.) afin de pouvoir modifier et travailler sur ce texte.
Les systèmes de Reconnaissance Optique de Caractères peuvent reconnaître différents types de polices et différents caractères imprimés
Pourquoi ?
Un Logiciel de Reconnaissance Optique de Caractère fait gagner un temps précieux, il analyse et traite tous les écrits. Plus besoin de copier des pages manuscrites sur un ordinateur grâce à l’OCR, la conversion est faite automatiquement. L’OCR est un outil simple à manipuler, et permet une conversion rapide des documents.
Au sein d’un document « océrisé », il est possible de rechercher un mot en particulier et d’extraire des informations sous la forme de métadonnées.