什麼是光學字符識別?

雖然在您的計算機上獲取文檔並使用打印機獲取物理副本很容易,但通常更難走另一條路。雖然存在掃描儀並且可以將掃描的文檔保存為圖像,但如果您想編輯文檔,這並不是特別有用。為了能夠編輯文檔,您需要使用一種稱為光學字符識別或 OCR 的技術。

光學字符識別是如何工作的?

OCR 使用一系列技術來準確讀取文檔。OCR 軟件會調整文檔,甚至可能是個別單詞,以便它們正確對齊。圖像被轉換為純黑白格式,因為這比區分灰色陰影更容易。還執行分析以識別和刪除任何非文本項目。

使用兩種主要類型的 OCR 算法,矩陣匹配和特徵提取。矩陣匹配獲取單個字符的圖像,然後逐個像素地將其與算法配置的字體進行比較。此技術要求字符與所有其他內容正確隔離,並且字體要包含在 OCR 軟件中。這種類型的 OCR 也不適用於識別筆跡。

特徵提取算法將每個字符分解為特徵,例如直線、曲線和直線交叉點。這種技術顯著降低了對使用已知字體訓練的算法的依賴。特徵提取能夠識別新字體並轉錄它們,以及一些筆跡,儘管準確性不如已知字體。

一些更高級的軟件使用周圍字母的上下文來幫助識別不太清楚的字母。例如,如果打印了單詞“dog”並且 OCR 算法無法確定“o”是“a”還是“o”,它可以使用字典來查看是否有任何潛在字符的組合做一個眾所周知的詞。在這種情況下,OCR 算法會忽略“a”的可能性,因為“dag”不是單詞,而“dog”是。

OCR 在哪裡使用?

OCR 的主要用途之一是在郵政系統中。OCR 用於自動識別信件和包裹的地址,它可以比人類更快地完成這項任務。如果 OCR 系統無法讀取標籤的地址,則會將其分離出來以供人工處理。

當與文本轉語音工具結合使用時,OCR 可用作視覺障礙人士的輔助工具。谷歌翻譯還將 OCR 作為翻譯圖像文本過程的一部分。



Leave a Comment

如何在Windows中将RAR文件转换为ZIP文件

如何在Windows中将RAR文件转换为ZIP文件

您是否有一些RAR文件想要转换为ZIP文件?了解如何将RAR文件转换为ZIP格式。

如何在Teams中设置重复会议

如何在Teams中设置重复会议

您需要在MS Teams上与相同的团队成员安排重复会议吗?了解如何在Teams中设置重复会议。

Adobe Reader:更改突出显示颜色

Adobe Reader:更改突出显示颜色

我们通过这篇逐步教程向您展示如何更改Adobe Reader中文本和文本字段的突出显示颜色。

Adobe Reader:更改默认缩放设置

Adobe Reader:更改默认缩放设置

本教程显示如何在Adobe Reader中更改默认缩放设置。

修复 Microsoft Teams: 对不起,我们无法连接您

修复 Microsoft Teams: 对不起,我们无法连接您

您在使用 MS Teams 时是否经常看到对不起,我们无法连接您的错误?尝试以下故障排除提示,以迅速解决此问题!

Spotify:禁用自动启动

Spotify:禁用自动启动

如果Spotify每次启动计算机时自动打开,它可能会让人感到恼火。按照这些步骤禁用自动启动。

LastPass: 发生错误与服务器联系

LastPass: 发生错误与服务器联系

如果 LastPass 无法连接到其服务器,请清除本地缓存,更新密码管理器,并禁用浏览器扩展。

如何将 Microsoft Teams 投射到电视上

如何将 Microsoft Teams 投射到电视上

Microsoft Teams 目前不支持直接将会议和通话投射到电视上。但您可以使用屏幕镜像应用程序来实现。

如何修复OneDrive错误代码0x8004de88

如何修复OneDrive错误代码0x8004de88

了解如何修复OneDrive错误代码0x8004de88,以便您可以再次使用云存储。

在Word中集成ChatGPT的3个步骤

在Word中集成ChatGPT的3个步骤

想知道如何将ChatGPT集成到Microsoft Word中?本指南将向您展示如何通过ChatGPT for Word插件轻松完成这项工作。