iPhone: So verwenden Sie die iOS-Texterkennungsfunktionen

Vision in iOS 11 bietet alles, was Sie brauchen, um eine App zu erstellen, die Textzeichen bei gleichzeitiger Implementierung erkennt. Sie benötigen keine technischen Programmierkenntnisse – die Navigation durch die Funktion ist recht einfach. Darüber hinaus ist die Implementierung nahtlos.

Vision-Framework

Mit dem Vision Framework können Sie jede Aufgabe, bei der es um Computerdetails geht, einfach implementieren. Die Struktur führt die Erkennung von Gesichtern und Gesichtern, Barcode-Erkennung, Bildregistrierung, allgemeine Merkmalsverfolgung und Texterkennung durch. Mit Vision können Sie auch benutzerdefinierte Core ML-Modelle für Aufgaben wie Klassifizierung oder Objekterkennung verwenden.

VN DetectTextRectanglesRequest

Die  VN DetectTextRectanglesRequest  ist eine Bildanalyseanforderung, die Bereiche mit sichtbarem Text in einem Bild findet; die Funktion gibt Textzeichen als rechteckigen Begrenzungsrahmen mit Ursprung und Größe zurück.

Wenn Sie an die Verwendung von Swift gewöhnt sind und schon eine Weile programmieren, fragen Sie sich wahrscheinlich, was der Nutzen von Vision ist, wenn es andere Funktionen wie Bild und AVFoundation gibt. Nun, Vision ist genauer und einfacher. Die Funktion ist auch auf einer Vielzahl von Plattformen verfügbar. Die Verwendung von Vision kann jedoch mehr Rechenleistung und Verarbeitungszeit erfordern.

Um Vision für die Texterkennung zu verwenden, benötigen Sie Xcode 9 und ein Gerät mit iOS 11.

Erstellen einer Kamera mit Avcapture

Zuerst müssen Sie mit AVCapture eine Kamera  erstellen ; Dies geschieht durch die Initialisierung einer Objekt-AVcapturesession, um Echtzeit- oder Offline-Captures durchzuführen. Stellen Sie danach die Sitzung mit der Geräteverbindung her.

Um Zeit beim Erstellen einer Benutzeroberfläche für Ihre App zu sparen, sollten Sie zunächst ein Starterprojekt in Betracht ziehen. Dies gibt Ihnen Zeit, sich auf das Erlernen des Vision-Frameworks zu konzentrieren.

Öffnen Sie Ihr Starterprojekt. Die Ansichten im Storyboard sollten alle bereit und für Sie eingerichtet sein.

Suchen Sie in  ViewController.swift  nach dem Codeabschnitt mit Funktionen und Ausgängen.

Deklarieren Sie unter dem Ausgang ImageView eine Sitzung für  AVcapturesession  – dies wird immer dann verwendet, wenn Aktionen basierend auf einem Live-Stream ausgeführt werden sollen.

Stellen Sie die  AVcapturesession  und den  AVmediatype  auf Video ein, da Sie die Kameraaufnahme durchführen, damit sie kontinuierlich ausgeführt wird

Definieren Sie das Ausgabe- und Eingabegerät

Die Eingabe ist das, was die Kamera sieht, und die Ausgabe ist das Video im eingestellten Typformat KCVPixelFormatType_32GRA.

Schließlich fügen Sie eine  Unterschicht ,  die Videos enthält  Imageview  und starten Sie die Sitzung. Die Funktion ist als  inViewdidload bekannt.  Sie müssen auch den Rahmen der Ebene festlegen.

Rufen Sie die Funktion in der   Methode viewWillAppear auf .

Da die Begrenzungen noch nicht abgeschlossen sind, überschreiben Sie die Methode viewDidLayoutSubviews ( ) , um die  Ebenenbegrenzung  zu aktualisieren.

Nach der Veröffentlichung von iOS 10 wird ein zusätzlicher Eintrag in der Info.plist benötigt, dies liefert einen Grund für die Kamera. Sie sollten auch die Verwendungsbeschreibung der Privatsphäre-Kamera festlegen.

Texterkennung; So funktioniert das Vision-Framework

Es gibt drei Schritte, um Vision in der App zu implementieren.

Handler –  Dies ist der Fall, wenn das Framework etwas tun soll, nachdem die Anforderung aufgerufen wurde.

Beobachtungen –  das möchten Sie mit den von Ihnen gelieferten Daten beginnend mit einer Anfrage machen

Anfragen –  Dies ist, wenn Sie nach dem Detect-Framework fragen

Idealerweise erstellen Sie eine Textanforderung als  VNdetecttextrectanglesrequest . Dies ist eine Art  VNrrequest  , die um den Text grenzt. Nachdem das Framework die Anwendung abgeschlossen hat, fahren Sie mit dem Aufrufen der  Dettexthandler-  Funktion fort. Sie möchten auch den genauen erkannten Frame wissen, setzen Sie ihn auf  Reportcharacterboxes =True.

Definieren Sie danach die Beobachtungen, die alle Ergebnisse von VNdetecttextrectanglesrequest enthalten.  Denken Sie daran, Vision zur Ausgabekamera hinzuzufügen. Da Vision High-Level-APIs bereitstellt, ist die Arbeit damit sicher.

Die Funktion prüft, ob der  Cmsamplebuffer  existiert und PutOut  Avcaptureoutput . Sie sollten dann fortfahren, eine Variable Requestoptions  als 1 Dictionary Type  VNimageoption zu erstellen  . Die   Option VNmage ist ein Strukturtyp, der Eigenschaften und Daten von der Kamera enthält. Anschließend sollten Sie den VNimagerequesthandler erstellen und die  Textanforderung  ausführen.

Zeichnen von Rahmen um den erkannten Text

Sie können damit beginnen, dass das Framework zwei Kästchen zeichnet, eines für jeden erkannten Buchstaben und das andere für jedes Wort. Tabellen sind die Kombination aller Zeichenfelder, die Ihre Anfrage findet.

  • Definieren Sie die Punkte in Ihrer Ansicht, um die Positionierung der Boxen zu erleichtern.
  • Erstellen Sie danach einen  CALaye r; Verwenden Sie  VNrectangleobservation  , um Ihre Beschränkungen zu definieren, um den Prozess des Umreißens der Box zu vereinfachen.

Sie haben jetzt alle Ihre Funktionen angeordnet.

Um Ihre Punkte zu verbinden, beginnen Sie damit, dass Ihr Code asynchron ausgeführt wird. Sie sollten dann überprüfen, ob eine Region in Ihren Ergebnissen aus Ihrer  VNTextObservation vorhanden ist .

Sie können nun Ihre Funktion aufrufen, die eine Box innerhalb des Bereichs zeichnet. Überprüfen Sie, ob es in der Region Zeichenfelder gibt, und rufen Sie dann den Dienst an, der ein Feld um jeden Buchstaben einfügt.

Erstellen Sie danach eine Variable  RequestOptions. Sie können jetzt ein VNImageRequestHandler- Objekt erstellen  und die von Ihnen erstellte Textanforderung  ausführen.

Der letzte Schritt ist schließlich das Ausführen Ihres Vision-Codes mit dem Live-Stream. Sie müssen die Videoausgabe nehmen und in Cmsamplebuffer konvertieren  .

Zusätzliche Tipps

Versuchen Sie immer, das Bild zuzuschneiden und nur den Abschnitt zu bearbeiten, den Sie benötigen. Dies reduziert die Verarbeitungszeit und den Speicherbedarf

Aktivieren Sie die Sprachkorrektur, wenn Sie mit nicht numerischen Zeichen arbeiten, und deaktivieren Sie sie, wenn Sie mit einem numerischen Zeichen arbeiten

Fügen Sie eine Validierung für erkannte Zahlenzeichenfolgen hinzu, um die Genauigkeit zu bestätigen und zu verhindern, dass dem Benutzer falsche Werte angezeigt werden.

Der Dokumentenkamera-Controller ist der beste Begleiter für die Texterkennung, da die Bildqualität bei der Texterkennung eine wichtige Rolle spielt.

Ziehen Sie in Erwägung, eine minimale Texthöhe festzulegen, um die Leistung zu steigern.

Mit Vision haben Sie alles, was Sie für die Texterkennung benötigen. Da Vision einfach zu bedienen ist und eine kurze Implementierungszeit in Anspruch nimmt, ist die Verwendung fast gleichbedeutend mit dem Spielen mit Legos. Testen Sie Ihre App mit verschiedenen Objekten, Schriftarten, Beleuchtung und Größen. Sie können sich auch selbst beeindrucken, indem Sie Vision mit Core ML kombinieren.



Leave a Comment

iPhone iMessage-Effekte aktivieren

iPhone iMessage-Effekte aktivieren

Aktivieren Sie iMessage-Effekte auf Ihrem iPhone für ein interaktives Messaging-Erlebnis. Erfahren Sie, wie Sie die Effekte aktivieren und nutzen können.

So verwischen Sie den Hintergrund in Ihren iPhone-Fotos

So verwischen Sie den Hintergrund in Ihren iPhone-Fotos

Erfahren Sie, wie Sie den Hintergrund auf Ihrem iPhone verwischen können, um perfekte Porträts zu erstellen. Nutzen Sie unsere Tipps für atemberaubende Ergebnisse.

iPhone & iPad: Zoom aktivieren oder deaktivieren

iPhone & iPad: Zoom aktivieren oder deaktivieren

Erfahren Sie, wie Sie die Zoom-Funktion auf Ihrem Apple iPhone oder iPad aktivieren oder deaktivieren.

So entfernen Sie Siri-App-Vorschläge auf iPhone und iPad

So entfernen Sie Siri-App-Vorschläge auf iPhone und iPad

Erfahren Sie, wie Sie Vorschläge für Siri-Apps auf Ihrem Apple iPhone und iPad löschen. Optimiere dein Nutzererlebnis mit einfachen Schritten.

Fehlerbehebung bei iPhone Gelbstich

Fehlerbehebung bei iPhone Gelbstich

Um das Gelbstichproblem auf Ihrem iPhone zu beheben, müssen Sie Ihre Farbeinstellungen anpassen, Night Shift und True Tone deaktivieren.

Safari Popup-Blocker aktivieren/deaktivieren: 5 Schritte & Tipps für alle Geräte

Safari Popup-Blocker aktivieren/deaktivieren: 5 Schritte & Tipps für alle Geräte

Step-by-Step Anleitung zum Blockieren von Popups in Safari auf MacOS (alle Versionen), iPhone und iPad. Inklusive Experten-Tipps für bessere Browsersicherheit.

5 Möglichkeiten, Anrufe auf dem iPhone stumm zu schalten

5 Möglichkeiten, Anrufe auf dem iPhone stumm zu schalten

Entdecken Sie fünf Möglichkeiten, Anrufe auf Ihrem iPhone stummzuschalten und unerwünschte Störungen zu vermeiden, um friedliche Momente zu genießen.

iPhone & iPad: Safari-Startseite einrichten

iPhone & iPad: Safari-Startseite einrichten

So legen Sie die Startseite für Safari auf Ihrem Apple iPhone oder iPad fest. Erfahren Sie die besten Tipps zur Optimierung Ihrer Nutzung.

So beheben Sie den Batterieverbrauch der Wetter-App unter iOS 16

So beheben Sie den Batterieverbrauch der Wetter-App unter iOS 16

Optimieren Sie den Batterieverbrauch der iOS Wetter-App unter iOS 16 mit diesen effektiven Lösungen und Tipps.

Die 5 besten Möglichkeiten, eine Collage auf dem iPhone zu erstellen

Die 5 besten Möglichkeiten, eine Collage auf dem iPhone zu erstellen

Erfahren Sie, wie Sie auf dem iPhone eindrucksvolle Collagen erstellen können. Hier sind die fünf besten Möglichkeiten, eine Collage auf dem iPhone zu erstellen.