iPhone: iOS-tekstdetectiefuncties gebruiken

Vision in iOS 11 heeft alles wat je nodig hebt om een ​​app te maken die teksttekens kan herkennen terwijl de implementatie tegelijkertijd plaatsvindt. U hebt geen technische kennis van coderen nodig - navigeren door de functie is vrij eenvoudig. Bovendien is de implementatie naadloos.

Visie Kader

Met het vision-framework kunt u eenvoudig elke taak uitvoeren waarbij computerdetails betrokken zijn. De structuur voert gezichtsherkenning en gezichtsherkenning, barcodeherkenning, beeldregistratie, algemene functie-tracking en tekstdetectie uit. Met Vision kunt u ook aangepaste Core ML-modellen gebruiken voor taken zoals classificatie of objectdetectie.

VN DetectTextRectanglesRequest

De  VN DetectTextRectanglesRequest  is een afbeeldingsanalyseverzoek dat gebieden met zichtbare tekst in een afbeelding vindt; de functie retourneert teksttekens als een rechthoekig begrenzingsvak met oorsprong en grootte.

Als je Swift gewend bent en al een tijdje aan het programmeren bent, dan vraag je je waarschijnlijk af wat het nut van Vision is als er andere functies zijn zoals beeld en AVFoundation. Welnu, Vision is nauwkeuriger en eenvoudiger. De functie is ook beschikbaar op verschillende platforms. Het gebruik van Vision kan echter meer verwerkingskracht en verwerkingstijd vereisen.

Om Vision te gebruiken voor tekstdetectie, hebt u Xcode 9 en een apparaat met iOS 11 nodig.

Een camera maken met Avcapture

Eerst moet je een camera maken met  AVCapture ; dit is door één object AVcapturesession te initialiseren om realtime of offline opname uit te voeren. Maak daarna de sessie naar de apparaatverbinding.

Om u tijd te besparen bij het bouwen van een gebruikersinterface van uw app, kunt u overwegen om om te beginnen een startproject te starten, zodat u zich kunt concentreren op het leren van het Vision-framework.

Open je startersproject. De weergaven in het storyboard moeten allemaal klaar en voor u zijn ingesteld.

Zoek op de ViewController.swift naar het  codegedeelte  met functies en uitgangen.

Declareer onder de outlet- ImageView een sessie voor  AVcapturesession  - dit wordt gebruikt wanneer u acties wilt laten uitvoeren op basis van een livestream.

Stel de  AV-opnamesessie  en het  AV-mediatype in  op video, aangezien u de camera-opname uitvoert zodat deze continu kan worden uitgevoerd

Definieer het uitvoer- en invoerapparaat

De invoer is wat de camera zal zien en de uitvoer is de video met een vast type formaat van KCVPixelFormatType_32GRA.

Voeg ten slotte een  sublaag  met video's toe aan  imageView  en start de sessie. De functie staat bekend als  inViewdidload.  U moet ook het frame van de laag instellen.

Roep de functie aan in de   methode viewWillAppear .

Aangezien de grenzen nog niet zijn voltooid, overschrijft u de  methode viewDidLayoutSubviews ( )  om de gebonden lagen bij te werken.

Na de release van iOS 10 is een extra vermelding in Info.plist nodig, dit geeft een reden om de camera te gebruiken. U moet ook de gebruiksbeschrijving van de privacycamera instellen.

Tekstdetectie; Hoe Vision Framework werkt

Er zijn drie stappen om Vision op de app te implementeren.

Handlers -  dit is wanneer u wilt dat het framework iets doet nadat het verzoek is aangeroepen.

Observaties -  dit is wat u wilt doen met de door u verstrekte gegevens beginnend met één verzoek

Verzoeken -  dit is wanneer u om Detect-framework vraagt

Idealiter maakt u één tekstverzoek aan als  VNdetecttextrectanglesrequest . Dit is een soort  VN-verzoek  dat om de tekst heen grenst. Nadat het framework de toepassing heeft voltooid, gaat u verder met het aanroepen van de   functie Dettexthandler . U wilt ook het exacte frame weten dat werd herkend, stel het in op  Reportcharacterboxes =True.

Definieer daarna de waarnemingen die alle resultaten van  VNdetecttextrectanglesrequest bevatten , vergeet niet om Vision toe te voegen aan de uitvoercamera. Omdat Vision API's op hoog niveau blootlegt, is het veilig om ermee te werken.

De functie controleert of de  Cmsamplebuffer  bestaat en PutOut  Avcaptureoutput . U moet dan doorgaan met het maken van één variabele  Requestoptions  als 1 Dictionary Type  VNimageoption . De   optie VNmage is een type structuur dat eigenschappen en gegevens van de camera bevat. U moet dan de  VNimagerequesthandler maken  en het tekstverzoek uitvoeren.

Randen tekenen rond de gedetecteerde tekst

U kunt beginnen door het raamwerk twee vakken te laten tekenen, één voor elke gedetecteerde letter en de andere voor elk woord. Tabellen zijn de combinatie van alle karaktervakken die uw verzoek zal vinden.

  • Definieer de punten op uw zicht om u te helpen bij het positioneren van de dozen.
  • Maak daarna een  CALaye r; gebruik  VNrectangleobservation  om uw beperkingen te definiëren, waardoor het proces van het schetsen van de box eenvoudiger wordt.

Je hebt nu al je functies op een rijtje.

Om uw punten met elkaar te verbinden, begint u door uw code asynchroon te laten lopen. U moet dan controleren of er een regio bestaat in uw resultaten van uw  VNTextObservation .

U kunt nu uw functie aanroepen, die een kader binnen het gebied zal tekenen. Controleer of er tekenvakken in de regio zijn en bel vervolgens de service die een vak rond elke letter binnenbrengt.

Maak daarna een variabele  RequestOptions. U kunt nu een  VNImageRequestHandler-  object maken en het tekstverzoek uitvoeren dat u hebt gemaakt.

Ten slotte is de laatste stap het uitvoeren van uw vision-code met de livestream. U moet de video-uitvoer nemen en deze converteren naar  Cmsamplebuffer.

Aanvullende tips

Probeer altijd de afbeelding bij te snijden en verwerk alleen de sectie die u nodig hebt. Dit vermindert de verwerkingstijd en de geheugenvoetafdruk

Schakel taalcorrectie in bij het omgaan met niet-numerieke tekens en schakel het vervolgens uit bij het omgaan met een numeriek teken

Voeg validatie toe voor herkende nummerreeksen om de nauwkeurigheid te bevestigen en elimineer het tonen van valse waarde aan de gebruiker.

De documentcameracontroller is de beste partner voor tekstherkenning, aangezien beeldkwaliteit een belangrijke rol speelt bij tekstherkenning.

Overweeg een minimale teksthoogte in te stellen om de prestaties te verbeteren.

Met Vision heeft u alles wat u nodig heeft voor tekstherkenning. Omdat Vision gemakkelijk te gebruiken is en weinig tijd kost om te implementeren, staat het gebruik ervan bijna gelijk aan spelen met Lego. Probeer uw app te testen op verschillende objecten, lettertypen, belichting en formaten. U kunt ook indruk maken door Vision te combineren met Core ML.



Leave a Comment

iPad: Hoe de SIM-kaart in te voegen of te verwijderen

iPad: Hoe de SIM-kaart in te voegen of te verwijderen

Leer hoe u toegang krijgt tot de SIM-kaart op de Apple iPad met deze handleiding.

IPhone Kaarten Navigatie Werkt Niet (Blijft Hangen)

IPhone Kaarten Navigatie Werkt Niet (Blijft Hangen)

In deze post behandelen we hoe je een probleem oplost waarbij kaartnavigatie en GPS-functies niet goed werken op de Apple iPhone.

Hoe iOS-applicaties in bulk te verwijderen

Hoe iOS-applicaties in bulk te verwijderen

Leer hoe je meerdere applicaties tegelijk van je iPhone kunt verwijderen met deze tutorial. Ontdek handige methoden en tips voor het beheren van je app-opslag.

Hoe Siri-app-suggesties op iPhone en iPad te verwijderen

Hoe Siri-app-suggesties op iPhone en iPad te verwijderen

Leer hoe u Siri-app-suggesties op uw Apple iPhone en iPad kunt verwijderen om een betere gebruikerservaring te krijgen.

5 eenvoudige manieren om verwijderde contacten op de iPhone te herstellen

5 eenvoudige manieren om verwijderde contacten op de iPhone te herstellen

Vraagt u zich af waar al uw contacten op uw iPhone zijn gebleven? Hier zijn 5 gegarandeerde manieren om verwijderde contacten op uw iPhone te herstellen.

Hoe Google Agenda op de iPhone te gebruiken en te delen

Hoe Google Agenda op de iPhone te gebruiken en te delen

Ontdek hoe u het meeste uit Google Agenda kunt halen. Hier leest u hoe u Google Agenda op uw iPhone kunt gebruiken, delen en nog veel meer kunt doen.

Locatiegeschiedenis controleren op iPhone, iPad en Mac

Locatiegeschiedenis controleren op iPhone, iPad en Mac

Om uw onlangs bezochte plaatsen bij te houden, leest u hoe u uw locatiegeschiedenis op iPhone, iPad en Mac kunt controleren.

3 beste manieren om fotos en videos op iPhone en iPad te hernoemen

3 beste manieren om fotos en videos op iPhone en iPad te hernoemen

Wilt u een foto of video op uw iPhone of iPad hernoemen? Hier zijn een paar verschillende manieren om dat snel en efficiënt te doen.

Hoe u contacten kunt toevoegen aan of verwijderen uit favorieten op de iPhone

Hoe u contacten kunt toevoegen aan of verwijderen uit favorieten op de iPhone

Heeft u bepaalde contacten die u vaak gebruikt? Hier ziet u hoe u contacten kunt toevoegen aan of verwijderen uit uw favorieten op uw iPhone.

6 manieren om het leeglopen van de iPhone-batterij tijdens het opladen te verhelpen

6 manieren om het leeglopen van de iPhone-batterij tijdens het opladen te verhelpen

Loopt de batterij van uw iPhone leeg tijdens het opladen? Hier zijn enkele eenvoudige maar effectieve oplossingen om te voorkomen dat de batterij van de iPhone leegloopt terwijl u oplaadt.