什麼是光學字符識別?

雖然在您的計算機上獲取文檔並使用打印機獲取物理副本很容易,但通常更難走另一條路。雖然存在掃描儀並且可以將掃描的文檔保存為圖像,但如果您想編輯文檔,這並不是特別有用。為了能夠編輯文檔,您需要使用一種稱為光學字符識別或 OCR 的技術。

光學字符識別是如何工作的?

OCR 使用一系列技術來準確讀取文檔。OCR 軟件會調整文檔,甚至可能是個別單詞,以便它們正確對齊。圖像被轉換為純黑白格式,因為這比區分灰色陰影更容易。還執行分析以識別和刪除任何非文本項目。

使用兩種主要類型的 OCR 算法,矩陣匹配和特徵提取。矩陣匹配獲取單個字符的圖像,然後逐個像素地將其與算法配置的字體進行比較。此技術要求字符與所有其他內容正確隔離,並且字體要包含在 OCR 軟件中。這種類型的 OCR 也不適用於識別筆跡。

特徵提取算法將每個字符分解為特徵,例如直線、曲線和直線交叉點。這種技術顯著降低了對使用已知字體訓練的算法的依賴。特徵提取能夠識別新字體並轉錄它們,以及一些筆跡,儘管準確性不如已知字體。

一些更高級的軟件使用周圍字母的上下文來幫助識別不太清楚的字母。例如,如果打印了單詞“dog”並且 OCR 算法無法確定“o”是“a”還是“o”,它可以使用字典來查看是否有任何潛在字符的組合做一個眾所周知的詞。在這種情況下,OCR 算法會忽略“a”的可能性,因為“dag”不是單詞,而“dog”是。

OCR 在哪裡使用?

OCR 的主要用途之一是在郵政系統中。OCR 用於自動識別信件和包裹的地址,它可以比人類更快地完成這項任務。如果 OCR 系統無法讀取標籤的地址,則會將其分離出來以供人工處理。

當與文本轉語音工具結合使用時,OCR 可用作視覺障礙人士的輔助工具。谷歌翻譯還將 OCR 作為翻譯圖像文本過程的一部分。



Leave a Comment

解決 iTunes 中的「iTunes Library.itl 檔案已鎖定」錯誤

解決 iTunes 中的「iTunes Library.itl 檔案已鎖定」錯誤

解決 Apple iTunes 錯誤,該錯誤指出 iTunes Library.itl 檔案已鎖定、位於鎖定的磁碟上,或您沒有對此檔案的寫入權限。

使用 Paint.NET 建立圓角

使用 Paint.NET 建立圓角

如何透過在 Paint.NET 中添加圓角來創建現代外觀的照片

iTunes:如何隨機播放或重複播放音樂

iTunes:如何隨機播放或重複播放音樂

不知道如何在 Apple iTunes 重複播放歌曲或播放清單?一開始我們也不能。以下是有關如何完成的一些詳細說明。

關於 WhatsApp 為我刪除您需要了解的一切

關於 WhatsApp 為我刪除您需要了解的一切

您是否在 WhatsApp 上使用「為我刪除」來刪除所有人的訊息?不用擔心!閱讀本文,了解在 WhatsApp 上為我撤銷刪除操作。

禁用 AVG 彈出通知

禁用 AVG 彈出通知

如何關閉螢幕右下角出現的煩人的 AVG 通知。

如何刪除您的 Instagram 帳戶

如何刪除您的 Instagram 帳戶

當您決定不再使用 Instagram 帳戶並想要刪除它。以下指南可協助您暫時或永久刪除 Instagram 帳號。

如何首次在 OBS 中設置直播 [2023]

如何首次在 OBS 中設置直播 [2023]

OBS 是許多內容創作者在 Twitch、YouTube 或 Discord 等熱門平台上進行流媒體播放時的首選。它允許您創建不同的場景,捕捉不同的來源,甚至...

如何在 Windows 11 上使用 Intel Unison 應用程序連接和同步您的 iPhone

如何在 Windows 11 上使用 Intel Unison 應用程序連接和同步您的 iPhone

Intel Unison 是一款出色的應用程序,可讓您將 iPhone 連接到 Windows 11 計算機。有了它,您可以直接從您的...訪問手機的通知、短信、照片等。

Microsoft Teams 不顯示圖像?怎麼修

Microsoft Teams 不顯示圖像?怎麼修

Microsoft Teams 最近一直處於提供視頻會議和遠程協作服務的前沿。儘管不是最用戶友好的,但該服務受到了組織的歡迎……

聯繫人未同步到 Apple Watch?怎麼修

聯繫人未同步到 Apple Watch?怎麼修

Apple Watch 讓您可以輕鬆地直接從手腕上撥打電話或向某人發送消息,但如果您的手錶上缺少聯繫人,您可能會面臨多個問題。這可能很煩人……