Co to jest optyczne rozpoznawanie znaków?

Chociaż łatwo jest zabrać dokument na komputer i uzyskać fizyczną kopię za pomocą drukarki, ogólnie trudniej jest przejść w drugą stronę. Chociaż skanery istnieją i mogą zapisywać zeskanowane dokumenty jako obraz, nie jest to szczególnie przydatne, jeśli chcesz edytować dokument. Aby móc edytować dokument, chcesz skorzystać z technologii zwanej optycznym rozpoznawaniem znaków lub OCR.

Jak działa optyczne rozpoznawanie znaków?

OCR wykorzystuje szereg technik do dokładnego odczytywania dokumentów. Oprogramowanie OCR dopasowuje dokument, a potencjalnie nawet pojedyncze słowa, tak aby były odpowiednio wyrównane. Obraz jest konwertowany do czystego czarno-białego formatu, ponieważ jest to łatwiejsze niż rozróżnianie odcieni szarości. Przeprowadzana jest również analiza w celu zidentyfikowania i usunięcia wszelkich elementów nietekstowych.

Stosowane są dwa główne typy algorytmów OCR: dopasowanie macierzy i ekstrakcja cech. Dopasowanie matrycy pobiera obraz pojedynczego znaku, a następnie porównuje go z czcionkami skonfigurowanymi przez algorytmy piksel po pikselu. Ta technika wymaga prawidłowego odizolowania znaku od wszelkiej innej zawartości oraz włączenia czcionki do oprogramowania OCR. Ten typ OCR nie działa również w przypadku rozpoznawania pisma ręcznego.

Algorytmy wyodrębniania cech dzielą każdy znak na cechy, takie jak linie, krzywe i przecięcia linii. Ta technika znacznie zmniejsza zależność od algorytmu uczonego przy użyciu znanych czcionek. Ekstrakcja funkcji jest w stanie rozpoznać nowe czcionki i przepisać je, a także niektóre pismo ręczne, chociaż dokładność nie jest tak dobra, jak w przypadku znanych czcionek.

Niektóre bardziej zaawansowane oprogramowanie wykorzystuje kontekst otaczających liter, aby pomóc w identyfikacji liter, które nie są tak wyraźne. Na przykład, jeśli drukowane jest słowo „pies”, a algorytm OCR nie może stwierdzić na pewno, czy „o” to „a” czy „o”, może użyć słownika, aby sprawdzić, czy jakakolwiek kombinacja potencjalnych znaków tworzy znane słowo. W tym przypadku algorytm OCR zdyskontowałby możliwość wystąpienia „a”, ponieważ „dag” nie jest słowem, a „pies” tak.

Gdzie jest używany OCR?

Jednym z głównych zastosowań OCR jest system pocztowy. OCR służy do automatycznej identyfikacji adresu listów i paczek, co może wykonać znacznie szybciej niż ludzie. W przypadkach, gdy system OCR nie jest w stanie odczytać adresu etykiety, zostanie on oddzielony, aby człowiek mógł go przetworzyć ręcznie.

OCR jest przydatny jako narzędzie ułatwień dostępu dla osób z wadami wzroku w połączeniu z narzędziem zamiany tekstu na mowę. Google translate wdraża również OCR w ramach procesu tłumaczenia tekstu w obrazach.



Leave a Comment

iTunes: „Nie można odczytać pliku „iTunes Library.itl”” Poprawka

iTunes: „Nie można odczytać pliku „iTunes Library.itl”” Poprawka

Jak rozwiązać problem z Apple iTunes, gdzie błąd Nie można odczytać pliku iTunes Library.itl, ponieważ został utworzony przez nowszą wersję iTunes. pojawia się po uruchomieniu aplikacji.

Discord Error 1006: co to oznacza i jak to naprawić

Discord Error 1006: co to oznacza i jak to naprawić

Błąd Discord 1006 wskazuje, że Twoje IP zostało zablokowane w korzystaniu ze strony Discord. Dowiedz się, jak to naprawić.

Microsoft Teams: udostępniaj dźwięk z komputera podczas spotkania

Microsoft Teams: udostępniaj dźwięk z komputera podczas spotkania

Microsoft Teams ma funkcję udostępniania ekranu i tryb prezentacji na spotkania. Udostępniaj dźwięk z komputera w Microsoft Teams, aby poprawić jakość komunikacji.

Rozwiązywanie problemów z błędem synchronizacji programu OneNote 0xE40200B4

Rozwiązywanie problemów z błędem synchronizacji programu OneNote 0xE40200B4

Rozwiązywanie problemów z błędem synchronizacji programu OneNote 0xE40200B4. Wykonaj kroki rozwiązywania problemów wymienione w tym przewodniku, aby przywrócić synchronizację.

Mapy Google: dowiedz się, jak skalibrować kompas

Mapy Google: dowiedz się, jak skalibrować kompas

Jeśli Twoja lokalizacja na żywo często się zacina podczas nawigacji w Mapach Google, naprawdę musisz skalibrować kompas. Przeczytaj nasz przewodnik, aby dowiedzieć się, jak to zrobić krok po kroku!

NAPRAW: Kod błędu Microsoft Teams 4c7 (krótki przewodnik)

NAPRAW: Kod błędu Microsoft Teams 4c7 (krótki przewodnik)

Dowiedz się, jak naprawić błąd 4c7 w Microsoft Teams. Przewodnik krok po kroku dla administratorów IT.

Microsoft Teams: jak znaleźć ukryte czaty

Microsoft Teams: jak znaleźć ukryte czaty

Aby znaleźć ukryte czaty Microsoft Teams, wyszukaj nazwisko uczestnika czatu, wybierz tę nazwę, a stary czat będzie ponownie widoczny.

Napraw Mapy Google, które nie mówią ani nie podają wskazówek

Napraw Mapy Google, które nie mówią ani nie podają wskazówek

Co się stanie, jeśli wskazówki głosowe nie działają w Mapach Google? W tym przewodniku dobrze pokażę, jak możesz rozwiązać problem.

Rozwiązywanie problemów z przeglądarką Opera nie ładuje stron

Rozwiązywanie problemów z przeglądarką Opera nie ładuje stron

Jeśli Opera nie wczytuje niektórych stron lub nie działa prawidłowo, oto, co powinieneś zrobić, aby rozwiązać te problemy i poprawić działanie przeglądarki.

Jak oszczędzać dane mobilne podczas słuchania Spotify

Jak oszczędzać dane mobilne podczas słuchania Spotify

Dowiedz się, jak zmniejszyć zużycie danych mobilnych podczas korzystania ze Spotify do słuchania muzyki.