Co to jest optyczne rozpoznawanie znaków?

Chociaż łatwo jest zabrać dokument na komputer i uzyskać fizyczną kopię za pomocą drukarki, ogólnie trudniej jest przejść w drugą stronę. Chociaż skanery istnieją i mogą zapisywać zeskanowane dokumenty jako obraz, nie jest to szczególnie przydatne, jeśli chcesz edytować dokument. Aby móc edytować dokument, chcesz skorzystać z technologii zwanej optycznym rozpoznawaniem znaków lub OCR.

Jak działa optyczne rozpoznawanie znaków?

OCR wykorzystuje szereg technik do dokładnego odczytywania dokumentów. Oprogramowanie OCR dopasowuje dokument, a potencjalnie nawet pojedyncze słowa, tak aby były odpowiednio wyrównane. Obraz jest konwertowany do czystego czarno-białego formatu, ponieważ jest to łatwiejsze niż rozróżnianie odcieni szarości. Przeprowadzana jest również analiza w celu zidentyfikowania i usunięcia wszelkich elementów nietekstowych.

Stosowane są dwa główne typy algorytmów OCR: dopasowanie macierzy i ekstrakcja cech. Dopasowanie matrycy pobiera obraz pojedynczego znaku, a następnie porównuje go z czcionkami skonfigurowanymi przez algorytmy piksel po pikselu. Ta technika wymaga prawidłowego odizolowania znaku od wszelkiej innej zawartości oraz włączenia czcionki do oprogramowania OCR. Ten typ OCR nie działa również w przypadku rozpoznawania pisma ręcznego.

Algorytmy wyodrębniania cech dzielą każdy znak na cechy, takie jak linie, krzywe i przecięcia linii. Ta technika znacznie zmniejsza zależność od algorytmu uczonego przy użyciu znanych czcionek. Ekstrakcja funkcji jest w stanie rozpoznać nowe czcionki i przepisać je, a także niektóre pismo ręczne, chociaż dokładność nie jest tak dobra, jak w przypadku znanych czcionek.

Niektóre bardziej zaawansowane oprogramowanie wykorzystuje kontekst otaczających liter, aby pomóc w identyfikacji liter, które nie są tak wyraźne. Na przykład, jeśli drukowane jest słowo „pies”, a algorytm OCR nie może stwierdzić na pewno, czy „o” to „a” czy „o”, może użyć słownika, aby sprawdzić, czy jakakolwiek kombinacja potencjalnych znaków tworzy znane słowo. W tym przypadku algorytm OCR zdyskontowałby możliwość wystąpienia „a”, ponieważ „dag” nie jest słowem, a „pies” tak.

Gdzie jest używany OCR?

Jednym z głównych zastosowań OCR jest system pocztowy. OCR służy do automatycznej identyfikacji adresu listów i paczek, co może wykonać znacznie szybciej niż ludzie. W przypadkach, gdy system OCR nie jest w stanie odczytać adresu etykiety, zostanie on oddzielony, aby człowiek mógł go przetworzyć ręcznie.

OCR jest przydatny jako narzędzie ułatwień dostępu dla osób z wadami wzroku w połączeniu z narzędziem zamiany tekstu na mowę. Google translate wdraża również OCR w ramach procesu tłumaczenia tekstu w obrazach.



Leave a Comment

Jak przekonwertować plik RAR na ZIP w systemie Windows

Jak przekonwertować plik RAR na ZIP w systemie Windows

Masz pliki RAR, które chcesz przekonwertować na pliki ZIP? Dowiedz się, jak przekonwertować plik RAR na format ZIP.

Jak ustawić spotkanie cykliczne w Teams

Jak ustawić spotkanie cykliczne w Teams

Czy musisz zorganizować cykliczne spotkania w MS Teams z tymi samymi członkami zespołu? Dowiedz się, jak ustawić spotkanie cykliczne w Teams. 

Adobe Reader: Zmień kolor podświetlenia

Adobe Reader: Zmień kolor podświetlenia

Pokazujemy, jak zmienić kolor podświetlenia tekstu i pól tekstowych w Adobe Reader w tym przewodniku krok po kroku.

Adobe Reader: Zmień domyślne ustawienie powiększenia

Adobe Reader: Zmień domyślne ustawienie powiększenia

W tym samouczku pokazujemy, jak zmienić domyślne ustawienie powiększenia w programie Adobe Reader.

Spotify: Wyłącz automatyczne uruchamianie

Spotify: Wyłącz automatyczne uruchamianie

Spotify może być irytujące, jeśli uruchamia się automatycznie za każdym razem, gdy uruchomisz komputer. Wyłącz automatyczne uruchamianie, korzystając z tych kroków.

LastPass: Wystąpił błąd podczas kontaktu z serwerem

LastPass: Wystąpił błąd podczas kontaktu z serwerem

Jeśli LastPass nie może się połączyć z serwerami, wyczyść lokalną pamięć podręczną, zaktualizuj menedżera haseł i wyłącz rozszerzenia przeglądarki.

Jak przesyłać Microsoft Teams na telewizor

Jak przesyłać Microsoft Teams na telewizor

Microsoft Teams obecnie nie obsługuje przesyłania spotkań i połączeń na Twój telewizor natywnie. Jednak można użyć aplikacji do lustra ekranu.

Jak naprawić błąd OneDrive Kod 0x8004de88

Jak naprawić błąd OneDrive Kod 0x8004de88

Dowiedz się, jak naprawić błąd OneDrive Kod 0x8004de88, aby przywrócić działanie przechowywania w chmurze.

3 Kroki do Zintegrowania ChatGPT z Wordem

3 Kroki do Zintegrowania ChatGPT z Wordem

Zastanawiasz się, jak zintegrować ChatGPT z Microsoft Word? Ten przewodnik pokaże Ci dokładnie, jak to zrobić z dodatkiem ChatGPT do Worda w 3 łatwych krokach.

Jak wyczyścić pamięć podręczną w Google Chrome

Jak wyczyścić pamięć podręczną w Google Chrome

Utrzymuj czystą pamięć podręczną w przeglądarce Google Chrome, postępuj��c zgodnie z tymi krokami.