¿Qué es el reconocimiento óptico de caracteres?

Si bien es fácil tomar un documento en su computadora y obtener una copia física con una impresora, generalmente es más difícil hacer lo contrario. Si bien existen escáneres y pueden guardar documentos escaneados como una imagen, esto no es particularmente útil si desea editar el documento. Para poder editar un documento, desea utilizar una tecnología llamada Reconocimiento óptico de caracteres u OCR.

¿Cómo funciona el reconocimiento óptico de caracteres?

OCR utiliza una variedad de técnicas para leer documentos con precisión. El software OCR ajusta el documento y, potencialmente, incluso las palabras individuales para que estén alineadas correctamente. La imagen se convierte a un formato en blanco y negro puro, ya que es más fácil que diferenciar los tonos de gris. También se realiza un análisis para identificar y eliminar cualquier elemento que no sea de texto.

Se utilizan dos tipos principales de algoritmos de OCR, la comparación de matrices y la extracción de características. La coincidencia de matrices toma una imagen de un solo carácter y luego la compara con las fuentes configuradas por los algoritmos píxel por píxel. Esta técnica requiere que el carácter esté correctamente aislado del resto del contenido y que la fuente se incluya en el software OCR. Este tipo de OCR tampoco funciona para reconocer la escritura a mano.

Los algoritmos de extracción de características dividen cada carácter en características, como líneas, curvas e intersecciones de líneas. Esta técnica reduce significativamente la dependencia del algoritmo que se entrena con fuentes conocidas. La extracción de características es capaz de reconocer nuevas fuentes y transcribirlas, así como algunas escrituras a mano, aunque la precisión no es tan buena como para las fuentes conocidas.

Algunos programas de software más avanzados utilizan el contexto de las letras circundantes para ayudar a identificar las letras que no son tan claras. Por ejemplo, si la palabra "perro" está impresa y el algoritmo de OCR no puede decir con certeza si la "o" es una "a" o una "o", puede usar un diccionario para ver si hay alguna combinación de caracteres potenciales hace una palabra conocida. En este caso, el algoritmo OCR descartaría la posibilidad de la "a", ya que "dag" no es una palabra, mientras que "perro" sí lo es.

¿Dónde se utiliza OCR?

Uno de los principales usos del OCR es el sistema postal. El OCR se utiliza para identificar automáticamente la dirección de cartas y paquetes, una tarea que puede hacer mucho más rápido que las personas. En los casos en que el sistema OCR no pueda leer la dirección de la etiqueta, se separará para que un humano la procese manualmente.

OCR es útil como herramienta de accesibilidad para personas con discapacidad visual cuando se combina con una herramienta de conversión de texto a voz. Google translate también implementa OCR como parte del proceso de traducción del texto en imágenes.



Leave a Comment

Cómo convertir un archivo RAR a ZIP en Windows

Cómo convertir un archivo RAR a ZIP en Windows

¿Tienes archivos RAR que deseas convertir en archivos ZIP? Aprende cómo convertir un archivo RAR a formato ZIP.

Cómo Configurar una Reunión Recurrente en Teams

Cómo Configurar una Reunión Recurrente en Teams

¿Necesitas programar reuniones recurrentes en MS Teams con los mismos miembros del equipo? Aprende a configurar una reunión recurrente en Teams.

Adobe Reader: Cambiar Color de Resaltado

Adobe Reader: Cambiar Color de Resaltado

Te mostramos cómo cambiar el color de resaltado para texto y campos de texto en Adobe Reader con este tutorial paso a paso.

Adobe Reader: Cambiar la Configuración de Zoom Predeterminada

Adobe Reader: Cambiar la Configuración de Zoom Predeterminada

En este tutorial, te mostramos cómo cambiar la configuración de zoom predeterminada en Adobe Reader.

Spotify: Desactivar el Inicio Automático

Spotify: Desactivar el Inicio Automático

Spotify puede ser molesto si se abre automáticamente cada vez que inicias tu computadora. Desactiva el inicio automático siguiendo estos pasos.

LastPass: Ocurrió un error al intentar contactar al servidor

LastPass: Ocurrió un error al intentar contactar al servidor

Si LastPass no puede conectarse a sus servidores, limpie la caché local, actualice el gestor de contraseñas y desactive las extensiones de su navegador.

Cómo transmitir Microsoft Teams a la TV

Cómo transmitir Microsoft Teams a la TV

Microsoft Teams actualmente no soporta transmitir sus reuniones y llamadas a su TV de forma nativa. Pero puede usar una aplicación de duplicación de pantalla.

Cómo Solucionar el Código de Error 0x8004de88 de OneDrive

Cómo Solucionar el Código de Error 0x8004de88 de OneDrive

Descubre cómo solucionar el Código de Error 0x8004de88 de OneDrive para que puedas volver a usar tu almacenamiento en la nube.

3 Pasos para Integrar ChatGPT en Word

3 Pasos para Integrar ChatGPT en Word

¿Te preguntas cómo integrar ChatGPT en Microsoft Word? Esta guía te muestra exactamente cómo hacerlo con el complemento ChatGPT para Word en 3 pasos sencillos.

Cómo borrar la caché en Google Chrome

Cómo borrar la caché en Google Chrome

Mantenga la caché despejada en su navegador web Google Chrome siguiendo estos pasos.