O que é reconhecimento óptico de caracteres?

Embora seja fácil pegar um documento no computador e obter uma cópia física com uma impressora, geralmente é mais difícil fazer o contrário. Embora existam scanners que possam salvar documentos digitalizados como imagens, isso não é particularmente útil se você quiser editar o documento. Para poder editar um documento, você deseja usar uma tecnologia chamada Reconhecimento Óptico de Caracteres ou OCR.

Como funciona o reconhecimento óptico de caracteres?

OCR usa uma variedade de técnicas para ler documentos com precisão. O software OCR ajusta o documento e, potencialmente, até mesmo palavras individuais para que sejam alinhadas corretamente. A imagem é convertida em um formato preto e branco puro, pois é mais fácil do que diferenciar tons de cinza. A análise também é realizada para identificar e remover quaisquer itens não textuais.

Dois tipos principais de algoritmos de OCR são usados, correspondência de matriz e extração de recursos. A correspondência de matriz obtém uma imagem de um único caractere e a compara com as fontes configuradas dos algoritmos pixel por pixel. Essa técnica requer que o caractere seja isolado corretamente de todos os outros conteúdos e que a fonte seja incluída no software OCR. Este tipo de OCR também não funciona para reconhecimento de escrita à mão.

Os algoritmos de extração de recursos dividem cada caractere em recursos, como linhas, curvas e interseções de linha. Essa técnica reduz significativamente a dependência do algoritmo sendo treinado com fontes conhecidas. A extração de recursos é capaz de reconhecer novas fontes e transcrevê-las, bem como alguns manuscritos, embora a precisão não seja tão boa quanto para fontes conhecidas.

Alguns softwares mais avançados usam o contexto das letras ao redor para ajudar a identificar as letras que não são tão claras. Por exemplo, se a palavra "cachorro" for impressa e o algoritmo de OCR não puder dizer com certeza se o "o" é um "a" ou um "o", ele pode usar um dicionário para ver se há alguma combinação de caracteres potenciais torna uma palavra conhecida. Nesse caso, o algoritmo OCR descartaria a possibilidade do “a”, pois “dag” não é uma palavra, enquanto “cachorro” é.

Onde o OCR é usado?

Um dos principais usos do OCR é no sistema postal. O OCR é usado para identificar automaticamente o endereço de cartas e encomendas, uma tarefa que pode fazer significativamente mais rápido do que as pessoas. Nos casos em que o sistema OCR não consegue ler o endereço da etiqueta, ele será separado para ser processado manualmente por uma pessoa.

O OCR é útil como uma ferramenta de acessibilidade para pessoas com deficiência visual quando combinado com uma ferramenta de conversão de texto em voz. O Google translate também implementa OCR como parte do processo de tradução do texto em imagens.



Leave a Comment

Notepad ++: como usar o “modo de coluna”

Notepad ++: como usar o “modo de coluna”

Aprenda a usar o modo de coluna no aplicativo de edição de texto Notepad ++ para facilitar a edição de documentos.

O que é GPU e como funciona no seu smartphone?

O que é GPU e como funciona no seu smartphone?

A GPU em um smartphone é crucial para o funcionamento de qualquer dispositivo ou tablet. É algo que pode fazer a diferença entre um bom telefone e um normal. Neste blog, vamos explorar o que exatamente é GPU e como funciona.

Microsoft Teams: como definir alertas de ausência temporária

Microsoft Teams: como definir alertas de ausência temporária

Aprenda a configurar mensagens de ausência temporária no Microsoft Teams e como isso pode ajudar sua comunicação.

Como começar a usar o fluxo de trabalho de aprovação do Microsoft Teams (2022)

Como começar a usar o fluxo de trabalho de aprovação do Microsoft Teams (2022)

Aprenda a utilizar o fluxo de trabalho de <strong>aprovação</strong> do Microsoft Teams com dicas e orientações úteis.

Como recortar uma imagem no Microsoft Powerpoint como um profissional

Como recortar uma imagem no Microsoft Powerpoint como um profissional

Aprenda como recortar uma imagem no Microsoft PowerPoint de forma fácil e profissional. Ferramentas úteis para cortes personalizados e rápidos.

Trello: como excluir uma equipe

Trello: como excluir uma equipe

Apenas administradores podem deletar equipes no Trello. Aprenda como excluir uma equipe no Trello de forma eficaz com este guia abrangente.

Como criar salas de sessão de grupo do Microsoft Teams

Como criar salas de sessão de grupo do Microsoft Teams

As reuniões online são quase sempre sinônimos de videochamada em grupo. Descubra como criar salas de sessão no Microsoft Teams para uma colaboração mais eficiente.

Como alterar o nome de usuário do Spotify

Como alterar o nome de usuário do Spotify

Aprenda como alterar o nome de exibição no Spotify. Descubra como personalizar sua conta facilmente em minutos!

O que é um arquivo JNLP? Como faço para abrir um?

O que é um arquivo JNLP? Como faço para abrir um?

Saiba tudo sobre arquivos JNLP, como abrir e executar programas Java com este guia completo. Aprenda sobre OpenWebStart e outras ferramentas.

Não consigo desinstalar o Discord do Windows

Não consigo desinstalar o Discord do Windows

Muitos usuários enfrentam dificuldades para desinstalar o Discord do Windows. Este guia oferece soluções eficazes para resolver o problema.