Was ist optische Zeichenerkennung?

Während es einfach ist, ein Dokument auf Ihrem Computer zu speichern und mit einem Drucker eine physische Kopie zu erhalten, ist es im Allgemeinen schwieriger, den umgekehrten Weg zu gehen. Es gibt zwar Scanner, die gescannte Dokumente als Bild speichern können, dies ist jedoch nicht besonders hilfreich, wenn Sie das Dokument bearbeiten möchten. Um ein Dokument bearbeiten zu können, möchten Sie eine Technologie namens Optical Character Recognition oder OCR verwenden.

Wie funktioniert die optische Zeichenerkennung?

OCR verwendet eine Reihe von Techniken, um Dokumente genau zu lesen. OCR-Software passt das Dokument und möglicherweise sogar einzelne Wörter an, damit sie richtig ausgerichtet sind. Das Bild wird in ein reines Schwarz-Weiß-Format umgewandelt, da dies einfacher ist, als zwischen Graustufen zu unterscheiden. Es wird auch eine Analyse durchgeführt, um alle Nicht-Textelemente zu identifizieren und zu entfernen.

Zwei Haupttypen von OCR-Algorithmen werden verwendet, Matrix-Matching und Merkmalsextraktion. Der Matrixvergleich nimmt ein Bild eines einzelnen Zeichens und vergleicht es dann Pixel für Pixel mit den vom Algorithmus konfigurierten Schriftarten. Diese Technik erfordert, dass das Zeichen korrekt von allen anderen Inhalten isoliert wird und dass die Schriftart in der OCR-Software enthalten ist. Diese Art von OCR funktioniert auch nicht für die Erkennung von Handschriften.

Merkmalsextraktionsalgorithmen unterteilen jedes Zeichen in Merkmale wie Linien, Kurven und Linienschnittpunkte. Diese Technik reduziert die Abhängigkeit vom Algorithmus, der mit bekannten Schriftarten trainiert wird, erheblich. Die Merkmalsextraktion ist in der Lage, neue Schriftarten zu erkennen und zu transkribieren, sowie einige Handschriften, obwohl die Genauigkeit nicht so gut ist wie bei bekannten Schriftarten.

Einige fortgeschrittene Software verwendet den Kontext der umgebenden Buchstaben, um Buchstaben zu identifizieren, die nicht so klar sind. Wenn zum Beispiel das Wort „Hund“ gedruckt wird und der OCR-Algorithmus nicht sicher sagen kann, ob das „o“ ein „a“ oder ein „o“ ist, kann er ein Wörterbuch verwenden, um zu sehen, ob eine beliebige Kombination möglicher Zeichen macht ein bekanntes Wort. In diesem Fall würde der OCR-Algorithmus die Möglichkeit des „a“ ausschließen, da „dag“ kein Wort ist, während „dog“ ein Wort ist.

Wo wird OCR verwendet?

Eine der Hauptanwendungen von OCR ist das Postsystem. OCR wird verwendet, um die Adresse von Briefen und Paketen automatisch zu identifizieren, eine Aufgabe, die es deutlich schneller erledigen kann, als Menschen es könnten. In Fällen, in denen das OCR-System die Adresse des Etiketts nicht lesen kann, wird es stattdessen von einem Menschen zur manuellen Verarbeitung ausgesondert.

OCR ist in Kombination mit einem Text-to-Speech-Tool als Barrierefreiheitstool für Menschen mit Sehbehinderungen nützlich. Google Translate implementiert auch OCR als Teil des Übersetzungsprozesses von Text in Bildern.



Leave a Comment

Wie man RAR-Dateien in ZIP unter Windows konvertiert

Wie man RAR-Dateien in ZIP unter Windows konvertiert

Haben Sie RAR-Dateien, die Sie in ZIP-Dateien konvertieren möchten? Erfahren Sie, wie Sie RAR-Dateien in das ZIP-Format konvertieren.

So richten Sie ein wiederkehrendes Meeting in Teams ein

So richten Sie ein wiederkehrendes Meeting in Teams ein

Müssen Sie wiederkehrende Meetings in MS Teams mit denselben Teammitgliedern planen? Erfahren Sie, wie Sie ein wiederkehrendes Meeting in Teams einrichten.

Adobe Reader: Farbe der Hervorhebung ändern

Adobe Reader: Farbe der Hervorhebung ändern

Wir zeigen Ihnen, wie Sie die Farbe der Hervorhebung für Texte und Textfelder in Adobe Reader mit diesem schrittweisen Tutorial ändern können.

Adobe Reader: Standard-Zoom-Einstellung ändern

Adobe Reader: Standard-Zoom-Einstellung ändern

In diesem Tutorial zeigen wir Ihnen, wie Sie die Standard-Zoom-Einstellung in Adobe Reader ändern.

Spotify: Automatischen Start deaktivieren

Spotify: Automatischen Start deaktivieren

Spotify kann lästig sein, wenn es automatisch jedes Mal geöffnet wird, wenn Sie Ihren Computer starten. Deaktivieren Sie den automatischen Start mit diesen Schritten.

LastPass: Ein Fehler ist beim Kontakt mit dem Server aufgetreten

LastPass: Ein Fehler ist beim Kontakt mit dem Server aufgetreten

Wenn LastPass keine Verbindung zu seinen Servern herstellen kann, löschen Sie den lokalen Cache, aktualisieren Sie den Passwortmanager und deaktivieren Sie Ihre Browsererweiterungen.

Wie man Microsoft Teams auf den Fernseher überträgt

Wie man Microsoft Teams auf den Fernseher überträgt

Microsoft Teams unterstützt momentan nicht die native Übertragung von Meetings und Anrufen auf Ihren Fernseher. Aber Sie können eine Bildschirmspiegelungs-App verwenden.

So beheben Sie den OneDrive-Fehlercode 0x8004de88

So beheben Sie den OneDrive-Fehlercode 0x8004de88

Erfahren Sie, wie Sie den OneDrive-Fehlercode 0x8004de88 beheben können, damit Sie Ihren Cloud-Speicher wieder nutzen können.

3 Schritte, um ChatGPT in Word zu integrieren

3 Schritte, um ChatGPT in Word zu integrieren

Sind Sie neugierig, wie Sie ChatGPT in Microsoft Word integrieren können? Diese Anleitung zeigt Ihnen genau, wie Sie es in 3 einfachen Schritten mit dem ChatGPT für Word-Add-in tun können.

So löschen Sie den Cache in Google Chrome

So löschen Sie den Cache in Google Chrome

Halten Sie den Cache in Ihrem Google Chrome-Webbrowser mit diesen Schritten sauber.