Nhận dạng ký tự quang học là gì?

Mặc dù thật dễ dàng để lấy một tài liệu trên máy tính của bạn và nhận một bản sao vật lý bằng máy in, nhưng nói chung là khó hơn để thực hiện theo cách khác. Mặc dù máy quét tồn tại và có thể lưu tài liệu đã quét dưới dạng hình ảnh, nhưng điều này không đặc biệt hữu ích nếu bạn muốn chỉnh sửa tài liệu. Để có thể chỉnh sửa tài liệu, bạn muốn sử dụng công nghệ có tên là Nhận dạng ký tự quang học hoặc OCR.

Nhận dạng ký tự quang học hoạt động như thế nào?

OCR sử dụng một loạt các kỹ thuật để đọc chính xác tài liệu. Phần mềm OCR điều chỉnh tài liệu và thậm chí cả các từ riêng lẻ để chúng được căn chỉnh chính xác. Hình ảnh được chuyển đổi thành định dạng đen trắng tinh khiết vì điều đó dễ dàng hơn so với việc phân biệt giữa các sắc thái của màu xám. Phân tích cũng được thực hiện để xác định và loại bỏ bất kỳ mục không phải văn bản nào.

Hai loại thuật toán OCR chính được sử dụng, so khớp ma trận và trích xuất tính năng. Đối sánh ma trận lấy hình ảnh của một ký tự đơn lẻ, sau đó so sánh nó với các thuật toán được định cấu hình phông chữ trên cơ sở từng pixel. Kỹ thuật này yêu cầu ký tự phải được cách ly chính xác khỏi tất cả các nội dung khác và để phông chữ được đưa vào phần mềm OCR. Loại OCR này cũng không hoạt động để nhận dạng chữ viết tay.

Các thuật toán trích xuất đối tượng địa lý chia nhỏ từng ký tự thành các đối tượng địa lý, chẳng hạn như đường thẳng, đường cong và giao điểm đường thẳng. Kỹ thuật này làm giảm đáng kể sự phụ thuộc vào thuật toán được đào tạo với các phông chữ đã biết. Tính năng trích xuất có khả năng nhận dạng các phông chữ mới và sao chép chúng, cũng như một số chữ viết tay, mặc dù độ chính xác không tốt như các phông chữ đã biết.

Một số phần mềm nâng cao hơn sử dụng ngữ cảnh của các chữ cái xung quanh để giúp xác định các chữ cái không rõ ràng. Ví dụ: nếu từ “dog” được in ra và thuật toán OCR không thể biết chắc chắn “o” là “a” hay “o”, nó có thể sử dụng từ điển để xem có bất kỳ sự kết hợp nào của các ký tự tiềm năng hay không. tạo ra một từ đã biết. Trong trường hợp này, thuật toán OCR sẽ giảm khả năng xuất hiện chữ “a”, vì “dag” không phải là một từ, trong khi “dog” thì có.

OCR được sử dụng ở đâu?

Một trong những ứng dụng chính của OCR là trong hệ thống bưu điện. OCR được sử dụng để tự động xác định địa chỉ của thư và bưu kiện, một nhiệm vụ mà nó có thể thực hiện nhanh hơn đáng kể so với con người. Trong trường hợp hệ thống OCR không thể đọc địa chỉ của nhãn, nó sẽ được tách ra để con người xử lý theo cách thủ công.

OCR hữu ích như một công cụ trợ năng cho người khiếm thị khi được kết hợp với công cụ chuyển văn bản thành giọng nói. Google dịch cũng triển khai OCR như một phần của quá trình dịch văn bản sang hình ảnh.



Leave a Comment

Sửa lỗi Skype Keeps Disconnecting trên PC

Sửa lỗi Skype Keeps Disconnecting trên PC

Skype liên tục ngắt kết nối và kết nối lại cho thấy kết nối mạng của bạn không ổn định hoặc bạn không có đủ băng thông.

Microsoft Teams: Cách bật phụ đề chi tiết

Microsoft Teams: Cách bật phụ đề chi tiết

Hướng dẫn chi tiết cách bật phụ đề trực tiếp trên Microsoft Teams giúp người dùng theo dõi cuộc họp hiệu quả hơn.

Cách xóa tài khoản Instagram của bạn

Cách xóa tài khoản Instagram của bạn

Khi bạn quyết định rằng bạn đã hoàn tất tài khoản Instagram của mình và muốn xóa nó. Dưới đây là hướng dẫn giúp bạn xóa tài khoản Instagram của mình tạm thời hoặc vĩnh viễn.

Microsoft Teams: Cách sửa mã lỗi CAA50021

Microsoft Teams: Cách sửa mã lỗi CAA50021

Để sửa lỗi Teams CAA50021, hãy liên kết thiết bị của bạn với Azure và cập nhật ứng dụng lên phiên bản mới nhất. Nếu sự cố vẫn tiếp diễn, hãy liên hệ với quản trị viên của bạn.

Cách ghi lại cuộc họp thu phóng cục bộ hoặc lên đám mây

Cách ghi lại cuộc họp thu phóng cục bộ hoặc lên đám mây

Ngoài ra, hãy xem cách bạn có thể ghi lại cuộc họp Zoom cục bộ hoặc lên đám mây, cách bạn có thể cho phép người khác ghi lại bất kỳ cuộc họp Zoom nào.

Cách tạo nhanh cuộc thăm dò ý kiến ​​trên Skype

Cách tạo nhanh cuộc thăm dò ý kiến ​​trên Skype

Nhanh chóng tạo một cuộc thăm dò Skype để chấm dứt bất kỳ cuộc thảo luận nào. Xem chúng dễ dàng tạo ra như thế nào.

Google Maps: Cách xóa nhãn

Google Maps: Cách xóa nhãn

Nếu một số nhãn Google Maps không còn phù hợp, bạn chỉ cần xóa chúng. Đây là cách bạn có thể làm điều đó.

Khắc phục: Microsoft Kaizala không hoạt động bình thường

Khắc phục: Microsoft Kaizala không hoạt động bình thường

Nếu Microsoft Kaizala không hoạt động trên máy tính của bạn, hãy xóa bộ nhớ cache của trình duyệt, tắt tiện ích mở rộng và cập nhật phiên bản trình duyệt của bạn.

Cách sửa mã lỗi Microsoft Teams CAA301F7

Cách sửa mã lỗi Microsoft Teams CAA301F7

Để khắc phục lỗi Nhóm CAA301F7, hãy chạy ứng dụng ở chế độ tương thích với quyền quản trị viên và xóa dữ liệu đăng nhập Nhóm của bạn khỏi Trình quản lý thông tin xác thực.

Cách nghe âm thanh WhatsApp trước khi gửi

Cách nghe âm thanh WhatsApp trước khi gửi

Nghe âm thanh WhatsApp trước khi gửi nó có thể là một cách cứu nguy. Bằng cách xem trước âm thanh, bạn có thể nghe xem giọng nói của mình có đúng như ý bạn không. Đảm bảo rằng âm thanh bạn đang gửi trong WhatsApp là hoàn hảo bằng cách xem trước nó với các bước sau.