Co to jest optyczne rozpoznawanie znaków?

Chociaż łatwo jest zabrać dokument na komputer i uzyskać fizyczną kopię za pomocą drukarki, ogólnie trudniej jest przejść w drugą stronę. Chociaż skanery istnieją i mogą zapisywać zeskanowane dokumenty jako obraz, nie jest to szczególnie przydatne, jeśli chcesz edytować dokument. Aby móc edytować dokument, chcesz skorzystać z technologii zwanej optycznym rozpoznawaniem znaków lub OCR.

Jak działa optyczne rozpoznawanie znaków?

OCR wykorzystuje szereg technik do dokładnego odczytywania dokumentów. Oprogramowanie OCR dopasowuje dokument, a potencjalnie nawet pojedyncze słowa, tak aby były odpowiednio wyrównane. Obraz jest konwertowany do czystego czarno-białego formatu, ponieważ jest to łatwiejsze niż rozróżnianie odcieni szarości. Przeprowadzana jest również analiza w celu zidentyfikowania i usunięcia wszelkich elementów nietekstowych.

Stosowane są dwa główne typy algorytmów OCR: dopasowanie macierzy i ekstrakcja cech. Dopasowanie matrycy pobiera obraz pojedynczego znaku, a następnie porównuje go z czcionkami skonfigurowanymi przez algorytmy piksel po pikselu. Ta technika wymaga prawidłowego odizolowania znaku od wszelkiej innej zawartości oraz włączenia czcionki do oprogramowania OCR. Ten typ OCR nie działa również w przypadku rozpoznawania pisma ręcznego.

Algorytmy wyodrębniania cech dzielą każdy znak na cechy, takie jak linie, krzywe i przecięcia linii. Ta technika znacznie zmniejsza zależność od algorytmu uczonego przy użyciu znanych czcionek. Ekstrakcja funkcji jest w stanie rozpoznać nowe czcionki i przepisać je, a także niektóre pismo ręczne, chociaż dokładność nie jest tak dobra, jak w przypadku znanych czcionek.

Niektóre bardziej zaawansowane oprogramowanie wykorzystuje kontekst otaczających liter, aby pomóc w identyfikacji liter, które nie są tak wyraźne. Na przykład, jeśli drukowane jest słowo „pies”, a algorytm OCR nie może stwierdzić na pewno, czy „o” to „a” czy „o”, może użyć słownika, aby sprawdzić, czy jakakolwiek kombinacja potencjalnych znaków tworzy znane słowo. W tym przypadku algorytm OCR zdyskontowałby możliwość wystąpienia „a”, ponieważ „dag” nie jest słowem, a „pies” tak.

Gdzie jest używany OCR?

Jednym z głównych zastosowań OCR jest system pocztowy. OCR służy do automatycznej identyfikacji adresu listów i paczek, co może wykonać znacznie szybciej niż ludzie. W przypadkach, gdy system OCR nie jest w stanie odczytać adresu etykiety, zostanie on oddzielony, aby człowiek mógł go przetworzyć ręcznie.

OCR jest przydatny jako narzędzie ułatwień dostępu dla osób z wadami wzroku w połączeniu z narzędziem zamiany tekstu na mowę. Google translate wdraża również OCR w ramach procesu tłumaczenia tekstu w obrazach.



Leave a Comment

Rozwiąż błąd „Plik iTunes Library.itl jest zablokowany” w iTunes

Rozwiąż błąd „Plik iTunes Library.itl jest zablokowany” w iTunes

Rozwiąż błąd Apple iTunes, który informuje, że plik iTunes Library.itl jest zablokowany, znajduje się na zablokowanym dysku lub nie masz uprawnień do zapisu tego pliku.

Twórz zaokrąglone rogi za pomocą Paint.NET

Twórz zaokrąglone rogi za pomocą Paint.NET

Jak tworzyć nowocześnie wyglądające zdjęcia, dodając zaokrąglone rogi w programie Paint.NET

ITunes: jak losowo lub powtarzać muzykę

ITunes: jak losowo lub powtarzać muzykę

Nie wiesz, jak powtórzyć utwór lub listę odtwarzania w Apple iTunes? Na początku też nie mogliśmy. Oto szczegółowe instrukcje dotyczące tego, jak to się robi.

Wszystko, co musisz wiedzieć o WhatsApp Usuń dla mnie

Wszystko, co musisz wiedzieć o WhatsApp Usuń dla mnie

Czy użyłeś opcji Usuń dla mnie na WhatsApp, aby usunąć wiadomości od wszystkich? Bez obaw! Przeczytaj to, aby dowiedzieć się, jak cofnąć opcję Usuń dla mnie w WhatsApp.

Wyłącz wyskakujące powiadomienia AVG

Wyłącz wyskakujące powiadomienia AVG

Jak wyłączyć irytujące powiadomienia AVG pojawiające się w prawym dolnym rogu ekranu.

Jak usunąć swoje konto na Instagramie

Jak usunąć swoje konto na Instagramie

Kiedy zdecydujesz, że skończyłeś ze swoim kontem na Instagramie i chcesz się go pozbyć. Oto przewodnik, który pomoże Ci tymczasowo lub trwale usunąć konto na Instagramie.

Microsoft Teams: jak naprawić kod błędu CAA50021

Microsoft Teams: jak naprawić kod błędu CAA50021

Aby naprawić błąd Teams CAA50021, połącz swoje urządzenie z platformą Azure i zaktualizuj aplikację do najnowszej wersji. Jeśli problem będzie się powtarzał, skontaktuj się z administratorem.

Acrobat Reader: Napraw „Wystąpił błąd podczas otwierania tego dokumentu. Brak dostępu.

Acrobat Reader: Napraw „Wystąpił błąd podczas otwierania tego dokumentu. Brak dostępu.

Rozwiąż Wystąpił błąd podczas otwierania tego dokumentu. Brak dostępu. komunikat o błędzie podczas próby otwarcia pliku PDF z klienta poczty e-mail.

10 najlepszych alternatyw Microsoft Teams w 2023 r

10 najlepszych alternatyw Microsoft Teams w 2023 r

Szukasz alternatyw Microsoft Teams do łatwej komunikacji? Znajdź dla siebie najlepsze alternatywy dla Microsoft Teams w 2023 roku.

9 najlepszych odpowiedników iMovie dla Windows 11

9 najlepszych odpowiedników iMovie dla Windows 11

Szukasz odpowiednika iMovie dla Windows 11/10? Dowiedz się, jakie alternatywy dla iMovie w systemie Windows możesz wypróbować do edycji wideo.