iPhone: Cómo utilizar las funciones de detección de texto de iOS

Vision en iOS 11 tiene todo lo que necesita para crear una aplicación que pueda reconocer caracteres de texto con implementación simultánea. No necesita conocimientos técnicos de codificación; navegar por la función es bastante simple. Además, la implementación es perfecta.

Marco de visión

El marco de visión le permite implementar fácilmente cualquier tarea que involucre detalles informáticos. La estructura realiza detección de puntos de referencia de rostros y rostros, reconocimiento de códigos de barras, registro de imágenes, seguimiento de características generales y detección de texto. Vision también le permite usar modelos Core ML personalizados para tareas como clasificación o detección de objetos.

VN DetectTextRectanglesRequest

El  VN DetectTextRectanglesRequest  es una petición de análisis de imágenes que encuentra regiones de texto visible en una imagen; la función devuelve caracteres de texto como un cuadro delimitador rectangular con origen y tamaño.

Si está acostumbrado a usar Swift y ha estado programando por un tiempo, entonces probablemente se esté preguntando cuál es el uso de Vision cuando hay otras características como imagen y AVFoundation. Bueno, Vision es más precisa y sencilla. La función también está disponible en una variedad de plataformas. Sin embargo, el uso de Vision puede requerir más potencia de procesamiento y tiempo de procesamiento.

Para usar Vision para la detección de texto, necesitará Xcode 9 y un dispositivo que ejecute iOS 11.

Creando una cámara con Avcapture

Primero, necesita crear una cámara con  AVCapture ; esto es mediante la inicialización de un objeto AVcapturesession para realizar una captura en tiempo real o fuera de línea. Después de eso, realice la sesión a la conexión del dispositivo.

Para ahorrarle tiempo en la creación de una interfaz de usuario de su aplicación, considere tener un proyecto de inicio, para empezar, esto le dará tiempo para concentrarse en aprender el marco Vision.

Abra su proyecto inicial. Las vistas en el guión gráfico deben estar listas y configuradas para usted.

En  ViewController.swift,  busque la sección de código con funciones y salidas.

Debajo de la salida ImageView, declare una sesión para  AVcapturesession  ; esto se usa siempre que desee que se realicen acciones basadas en una transmisión en vivo.

Configure  AVcapturesession  y  AVmediatype  en video, ya que realizará la toma de la cámara para permitir que se ejecute continuamente.

Definir el dispositivo de entrada y salida

La entrada es lo que verá la cámara y la salida es el video en un formato de tipo establecido de KCVPixelFormatType_32GRA.

Finalmente, agregue una  subcapa  que contenga videos a  imageView  e inicie la sesión. La función se conoce como  inViewdidload.  También necesitas establecer el marco de la capa.

Llame a la función en el   método viewWillAppear .

Como los límites aún no están finalizados, anule el  método viewDidLayoutSubviews ()  para actualizar los límites de las capas.

Después del lanzamiento de iOS 10, se necesita una entrada adicional en Info.plist, esto proporciona una razón para usar la cámara. También debe configurar la Descripción de uso de la cámara de privacidad.

Detección de texto; Cómo funciona Vision Framework

Hay tres pasos para implementar Vision en la aplicación.

Controladores:  aquí es cuando desea que el marco haga algo después de que se llame a la solicitud.

Observaciones:  esto es lo que desea hacer con los datos proporcionados por usted, comenzando con una solicitud

Solicitudes:  aquí es cuando solicita el marco de detección

Idealmente, crea una solicitud de texto como  VNdetecttextrectanglesrequest . Esta es una especie de  VNrequest  que bordea el texto. Una vez que el marco completa la aplicación, se procede a llamar a la   función Dettexthandler . También querrá saber el marco exacto que se reconoció, configúrelo en  Reportcharacterboxes = True.

Después de eso, defina las observaciones que contienen todos los resultados de  VNdetecttextrectanglesrequest , recuerde agregar Vision a la cámara de salida. Dado que Vision expone API de alto nivel, trabajar con ellas es seguro.

La función comprueba si el  Cmsamplebuffer  existe y putout  Avcaptureoutput . Luego debe proceder a crear una Requestoptions  variable  como 1 Dictionary Type  VNimageoption . La   opción VNmage es un tipo de estructura que contiene propiedades y datos de la cámara. Luego, debe crear el  administrador de solicitudes de VNimage  y ejecutar la solicitud de texto.

Dibujar bordes alrededor del texto detectado

Puedes empezar por tener el marco para dibujar dos cuadros, uno por cada letra que detecta y el otro por cada palabra. Las tablas son la combinación de todos los cuadros de caracteres que encontrará su solicitud.

  • Defina los puntos de su vista para ayudarlo a colocar las cajas.
  • Después de eso, cree un  CALaye r; use  VNrectangleobservation  para definir sus restricciones, facilitando el proceso de delinear el cuadro.

Ahora tiene todas sus funciones establecidas.

Para conectar sus puntos, comience haciendo que su código se ejecute de forma asincrónica. Luego, debe verificar si existe una región dentro de sus resultados de su  VNTextObservation .

Ahora puede llamar a su función, que dibujará un cuadro dentro del área. Verifique si hay cuadros de caracteres dentro de la región y luego llame al servicio que trae un cuadro alrededor de cada letra.

Después de eso, cree una variable  RequestOptions. Ahora puede crear un  objeto VNImageRequestHandler  y realizar la solicitud de texto que creó.

Finalmente, el último paso es ejecutar su código de visión con la transmisión en vivo. Deberá tomar la salida de video y convertirla a  Cmsamplebuffer.

Consejos adicionales

Intente siempre recortar la imagen y procesar solo la sección que necesite. Esto reducirá el tiempo de procesamiento y la huella de memoria.

Active la corrección de idioma cuando se trate de caracteres no numéricos y luego desactívela cuando se trate de un carácter numérico

Incluya la validación de las cadenas de números reconocidas para confirmar la precisión y eliminar la presentación de valores falsos al usuario.

El controlador de la cámara de documentos es el mejor compañero para el reconocimiento de texto, ya que la calidad de la imagen juega un papel importante en el reconocimiento de texto.

Considere establecer una altura mínima de texto para aumentar el rendimiento.

Con Vision, tiene todo lo que necesita para el reconocimiento de texto. Dado que Vision es fácil de usar y requiere poco tiempo para su implementación, usarlo es casi equivalente a jugar con Legos. Intente probar su aplicación en diferentes objetos, fuentes, iluminación y tamaños. También puede impresionarse combinando Vision con Core ML.



Leave a Comment

IPhone o iPad: La pantalla aparece demasiado grande o demasiado ampliada

IPhone o iPad: La pantalla aparece demasiado grande o demasiado ampliada

Resuelve un problema donde la pantalla del Apple iPhone o iPad parece ampliada y es demasiado grande para usar debido a un problema de zoom del iPhone.

IPad: Cómo insertar o quitar la tarjeta SIM

IPad: Cómo insertar o quitar la tarjeta SIM

Aprende a acceder a la tarjeta SIM en el Apple iPad con este tutorial.

No Funciona la Navegación de Mapas en el iPhone (Se Queda Atascada)

No Funciona la Navegación de Mapas en el iPhone (Se Queda Atascada)

En este artículo abordamos cómo resolver el problema donde la navegación y las funciones de GPS no funcionan correctamente en el Apple iPhone.

Cómo Restablecer la Configuración del iPhone y iPad: 7 Mejores Métodos

Cómo Restablecer la Configuración del iPhone y iPad: 7 Mejores Métodos

Si te gusta modificar la configuración de iOS o quieres solucionar problemas, aprender a restablecer la configuración del iPhone y iPad te ayudará. ¡Lee ahora!

10 soluciones para WhatsApp sigue fallando o no se abre en iPhone

10 soluciones para WhatsApp sigue fallando o no se abre en iPhone

¿WhatsApp sigue fallando o no se abre en tu iPhone? Echemos un vistazo a 10 formas sencillas para solucionar este problema de manera efectiva.

Cómo utilizar la aplicación meteorológica de Apple en iPhone

Cómo utilizar la aplicación meteorológica de Apple en iPhone

¿Quieres aprender a usar la aplicación Apple Weather en iPhone? Aquí hay una guía completa sobre sus funciones y cómo sacarle el máximo provecho.

Configuración de pantalla giratoria de iPhone

Configuración de pantalla giratoria de iPhone

Aprende cómo configurar la pantalla giratoria de tu iPhone para mejorar tu experiencia de usuario mientras usas tus dispositivos.

Cómo reparar el error 54 de sincronización de iTunes en iPhone, iPad o iPod

Cómo reparar el error 54 de sincronización de iTunes en iPhone, iPad o iPod

¿Frustrado con el error 54 de sincronización de iTunes? ¡Soluciona este problema rápidamente! Conoce las causas y las mejores soluciones para corregir el error de sincronización de iTunes.

Las 5 mejores formas de hacer un collage en iPhone

Las 5 mejores formas de hacer un collage en iPhone

Descubre cómo crear collages impresionantes en tu iPhone con estas 5 aplicaciones eficaces. Aprende y comparte tus recuerdos fácilmente.

9 formas de organizar fotos en iPhone

9 formas de organizar fotos en iPhone

¿Tu biblioteca de fotos es un desastre? No entre en pánico, aquí le presentamos nueve formas de <strong>organizar y administrar sus fotos en su iPhone</strong> como un profesional.