¿Qué es el reconocimiento óptico de caracteres?

Si bien es fácil tomar un documento en su computadora y obtener una copia física con una impresora, generalmente es más difícil hacer lo contrario. Si bien existen escáneres y pueden guardar documentos escaneados como una imagen, esto no es particularmente útil si desea editar el documento. Para poder editar un documento, desea utilizar una tecnología llamada Reconocimiento óptico de caracteres u OCR.

¿Cómo funciona el reconocimiento óptico de caracteres?

OCR utiliza una variedad de técnicas para leer documentos con precisión. El software OCR ajusta el documento y, potencialmente, incluso las palabras individuales para que estén alineadas correctamente. La imagen se convierte a un formato en blanco y negro puro, ya que es más fácil que diferenciar los tonos de gris. También se realiza un análisis para identificar y eliminar cualquier elemento que no sea de texto.

Se utilizan dos tipos principales de algoritmos de OCR, la comparación de matrices y la extracción de características. La coincidencia de matrices toma una imagen de un solo carácter y luego la compara con las fuentes configuradas por los algoritmos píxel por píxel. Esta técnica requiere que el carácter esté correctamente aislado del resto del contenido y que la fuente se incluya en el software OCR. Este tipo de OCR tampoco funciona para reconocer la escritura a mano.

Los algoritmos de extracción de características dividen cada carácter en características, como líneas, curvas e intersecciones de líneas. Esta técnica reduce significativamente la dependencia del algoritmo que se entrena con fuentes conocidas. La extracción de características es capaz de reconocer nuevas fuentes y transcribirlas, así como algunas escrituras a mano, aunque la precisión no es tan buena como para las fuentes conocidas.

Algunos programas de software más avanzados utilizan el contexto de las letras circundantes para ayudar a identificar las letras que no son tan claras. Por ejemplo, si la palabra "perro" está impresa y el algoritmo de OCR no puede decir con certeza si la "o" es una "a" o una "o", puede usar un diccionario para ver si hay alguna combinación de caracteres potenciales hace una palabra conocida. En este caso, el algoritmo OCR descartaría la posibilidad de la "a", ya que "dag" no es una palabra, mientras que "perro" sí lo es.

¿Dónde se utiliza OCR?

Uno de los principales usos del OCR es el sistema postal. El OCR se utiliza para identificar automáticamente la dirección de cartas y paquetes, una tarea que puede hacer mucho más rápido que las personas. En los casos en que el sistema OCR no pueda leer la dirección de la etiqueta, se separará para que un humano la procese manualmente.

OCR es útil como herramienta de accesibilidad para personas con discapacidad visual cuando se combina con una herramienta de conversión de texto a voz. Google translate también implementa OCR como parte del proceso de traducción del texto en imágenes.



Leave a Comment

Cómo cambiar su nombre en Google Meet

Cómo cambiar su nombre en Google Meet

Descubre cómo cambiar tu nombre en Google Meet para facilitar la identificación en las reuniones. Aprende a hacerlo con o sin cuenta de Google.

¿Dónde se guardan mis grabaciones de Microsoft Teams?

¿Dónde se guardan mis grabaciones de Microsoft Teams?

A partir de enero de 2021, Microsoft Teams almacena automáticamente nuevas grabaciones de reuniones en OneDrive para empresas y SharePoint, en lugar de Stream. Aprende cómo acceder a ellas.

Cómo escribir sobre una imagen en Microsoft Word

Cómo escribir sobre una imagen en Microsoft Word

Aprenda cómo escribir sobre una imagen en Microsoft Word, ideal para agregar marcas de agua y personalizar sus documentos fácilmente.

Google Meet vs Zoom: cuál es mejor

Google Meet vs Zoom: cuál es mejor

Google Meet y Zoom son dos aplicaciones populares para reuniones en línea. Descubre cuál es la mejor opción para ti con nuestra comparativa detallada sobre precios, funciones y más.

Discordia: cómo usar negrita, cursiva y subrayado para enfatizar el texto

Discordia: cómo usar negrita, cursiva y subrayado para enfatizar el texto

Aprende a usar los estilos de texto en Discord para mejorar la comunicación. Incluye negrita, cursiva y subrayado, cruciales para destacar en la interacción.

¿No puede iniciar sesión en QuickBooks Online? Utilice estas correcciones

¿No puede iniciar sesión en QuickBooks Online? Utilice estas correcciones

Si no puede iniciar sesión en su cuenta de QuickBooks, utilice un enlace de inicio de sesión alternativo. Luego, agregue QuickBooks como un sitio confiable y limpie su DNS.

Configurar el enrutamiento directo de Teams: la guía definitiva (2022)

Configurar el enrutamiento directo de Teams: la guía definitiva (2022)

Este documento describe cómo configurar el modelo de alojamiento de enrutamiento directo de los equipos, incluyendo mejoras recientes en la configuración de SBC de AudioCodes.

Tarjeta gráfica integrada o dedicada: cuál elegir

Tarjeta gráfica integrada o dedicada: cuál elegir

Descubre las diferencias entre tarjetas gráficas integradas y dedicadas para decidir cuál es la mejor opción según tus necesidades.

Evitar que Microsoft Teams se instale o inicie automáticamente al iniciar

Evitar que Microsoft Teams se instale o inicie automáticamente al iniciar

Descubre cómo evitar que Microsoft Teams se instale y arranque automáticamente al iniciar sesión en tu ordenador. Aprende los pasos necesarios para ello.

Equipos de Microsoft: Cómo corregir el código de error CAA50021

Equipos de Microsoft: Cómo corregir el código de error CAA50021

Para corregir el error de Teams CAA50021, vincule su dispositivo a Azure y actualice la aplicación a la última versión. Si el problema persiste, comuníquese con su administrador.