Quest-ce que la reconnaissance optique de caractères ?

S'il est facile de prendre un document sur votre ordinateur et d'en obtenir une copie physique avec une imprimante, il est généralement plus difficile d'aller dans l'autre sens. Bien que les scanners existent et puissent enregistrer les documents numérisés sous forme d'image, cela n'est pas particulièrement utile si vous souhaitez modifier le document. Pour pouvoir modifier un document, vous souhaitez utiliser une technologie appelée reconnaissance optique de caractères ou OCR.

Comment fonctionne la reconnaissance optique de caractères ?

L'OCR utilise une gamme de techniques pour lire avec précision les documents. Le logiciel OCR ajuste le document, et potentiellement même les mots individuels afin qu'ils soient correctement alignés. L'image est convertie en un format noir et blanc pur car c'est plus facile que de différencier les nuances de gris. Une analyse est également effectuée pour identifier et supprimer tous les éléments non textuels.

Deux principaux types d'algorithmes OCR sont utilisés, l'appariement matriciel et l'extraction de caractéristiques. La correspondance matricielle prend une image d'un seul caractère puis la compare aux polices configurées par les algorithmes pixel par pixel. Cette technique nécessite que le caractère soit correctement isolé de tout autre contenu et que la police soit incluse dans le logiciel OCR. Ce type d'OCR ne fonctionne pas non plus pour reconnaître l'écriture manuscrite.

Les algorithmes d'extraction de caractéristiques décomposent chaque caractère en caractéristiques, telles que des lignes, des courbes et des intersections de lignes. Cette technique réduit considérablement le recours à l'algorithme entraîné avec des polices connues. L'extraction de caractéristiques est capable de reconnaître de nouvelles polices et de les transcrire, ainsi que certaines écritures manuscrites, bien que la précision ne soit pas aussi bonne que pour les polices connues.

Certains logiciels plus avancés utilisent le contexte des lettres environnantes pour aider à identifier les lettres qui ne sont pas aussi claires. Par exemple, si le mot "chien" est imprimé et que l'algorithme OCR ne peut pas dire avec certitude si le "o" est un "a" ou un "o", il peut utiliser un dictionnaire pour voir si une combinaison de caractères potentiels fait un mot connu. Dans ce cas, l'algorithme OCR écarterait la possibilité du « a », car « dag » n'est pas un mot, alors que « chien » l'est.

Où l'OCR est-elle utilisée ?

L'une des principales utilisations de l'OCR est dans le système postal. L'OCR est utilisé pour identifier automatiquement l'adresse des lettres et des colis, une tâche qu'il peut effectuer beaucoup plus rapidement que les gens. Dans les cas où le système OCR est incapable de lire l'adresse de l'étiquette, elle sera séparée pour qu'un humain puisse la traiter manuellement à la place.

L'OCR est utile en tant qu'outil d'accessibilité pour les personnes malvoyantes lorsqu'il est associé à un outil de synthèse vocale. Google translate implémente également l'OCR dans le cadre du processus de traduction du texte en images.

Comment *

Name *

Website

Comment convertir un fichier RAR en ZIP sous Windows

Vous avez des fichiers RAR que vous souhaitez convertir en fichiers ZIP ? Découvrez comment convertir un fichier RAR en format ZIP.

Comment configurer une réunion récurrente dans Teams

Avez-vous besoin de planifier des réunions récurrentes sur MS Teams avec les mêmes membres de l’équipe ? Découvrez comment configurer une réunion récurrente dans Teams.

Adobe Reader : Changer la couleur de surlignage

Nous vous montrons comment changer la couleur de surlignage pour le texte et les champs de texte dans Adobe Reader avec ce tutoriel étape par étape.

Adobe Reader : Modifier le paramètre de zoom par défaut

Dans ce tutoriel, nous vous montrons comment modifier le paramètre de zoom par défaut dans Adobe Reader.

Spotify : Désactiver le démarrage automatique

Spotify peut être agaçant s

LastPass : Une erreur est survenue lors de la connexion au serveur

Si LastPass ne parvient pas à se connecter à ses serveurs, effacez le cache local, mettez à jour le gestionnaire de mots de passe et désactivez les extensions de votre navigateur.

Comment diffuser Microsoft Teams sur votre TV

Microsoft Teams ne prend actuellement pas en charge la diffusion de vos réunions et appels sur votre TV nativement. Mais vous pouvez utiliser une application de mise en miroir d’écran.

Comment réparer le code d'erreur OneDrive 0x8004de88

Découvrez comment réparer le code d

3 Étapes pour Intégrer ChatGPT dans Word

Vous vous demandez comment intégrer ChatGPT dans Microsoft Word ? Ce guide vous montre exactement comment le faire avec l’add-in ChatGPT pour Word en 3 étapes simples.

Comment vider le cache dans Google Chrome

Gardez le cache de votre navigateur Google Chrome vide avec ces étapes.