Hoe maak je een Deep Learning REST API met Word2Vec en Flask

Traditionele benaderingen van ontwikkeling zijn moeilijk te handhaven bij het gebruik van complexe machine learning-modellen in productie. Ontwikkeling op een laptop of lokale machine kan traag zijn om het machine learning-model te trainen voor deep learning-ingenieurs. Als gevolg hiervan maken we doorgaans gebruik van cloudmachines met krachtigere hardware om onze modellen voor machine learning zowel te trainen als uit te voeren. Dit is een goede gewoonte, omdat we complexe berekeningen abstraheren en in plaats daarvan AJAX-verzoeken indienen. In deze tutorial zullen we een vooraf opgeleid deep learning-model met de naam Word2Vec beschikbaar maken voor andere services door vanaf het begin een REST-API te bouwen.

Vereisten

  • Een Ubuntu 16.04-serverinstantie met minimaal 4 GB RAM. Voor test- en ontwikkelingsdoeleinden kunt u een exemplaar met 4 GB RAM kiezen
  • Begrijpen hoe u het Linux-besturingssysteem gebruikt om mappen en bestanden te maken / navigeren / bewerken
  • Een sudogebruiker

Wat zijn Word-insluitingen?

Inbedding van woorden is een recente ontwikkeling in natuurlijke taalverwerking en diepgaand leren die door snelle vooruitgang een revolutie teweeg heeft gebracht op beide gebieden. Woordinsluitingen zijn in wezen vectoren die elk overeenkomen met een enkel woord, zodat de vectoren de woorden betekenen. Dit kan worden aangetoond door bepaalde verschijnselen zoals de vector voor king - queen = boy - girl. Woordvectoren worden gebruikt om alles te bouwen, van aanbevelingsengines tot chatbots die de Engelse taal daadwerkelijk begrijpen.

Inbedding van woorden is niet willekeurig; ze worden gegenereerd door een neuraal netwerk te trainen. Een recente krachtige implementatie van woordintegratie komt van Google, genaamd Word2Vec, dat is getraind door woorden te voorspellen die naast andere woorden in een taal verschijnen. Voor het woord "cat"zal het neurale netwerk bijvoorbeeld de woorden "kitten"en voorspellen "feline". Deze intuïtie van woorden die naast elkaar verschijnen, stelt ons in staat ze in vectorruimte te plaatsen.

In de praktijk gebruiken we echter de voorgetrainde modellen van andere grote bedrijven zoals Google om snel prototypen te maken en implementatieprocessen te vereenvoudigen. In deze zelfstudie downloaden en gebruiken we vooraf getrainde woordinsluitingen van Word2Vec van Google. We kunnen dit doen door de volgende opdracht uit te voeren in onze werkdirectory.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

De pakketten voor flacon en magnitude installeren

Het woord embedding-model dat we hebben gedownload, heeft een .magnitudeindeling. Dit formaat stelt ons in staat om het model efficiënt te bevragen met behulp van SQL, en is daarom het optimale inbeddingsformaat voor productieservers. Omdat we het .magnitudeformaat moeten kunnen lezen , installeren we het pymagnitudepakket. We zullen ook installeren flaskom later de deep learning-voorspellingen van het model te dienen.

pip3 install pymagnitude flask

We zullen het ook toevoegen aan onze afhankelijkheidstracker met de volgende opdracht. Dit creëert een bestand met de naam requirements.txten slaat onze Python-bibliotheken op, zodat we ze later opnieuw kunnen installeren.

pip3 freeze > requirements.txt

Het Word2Vec-model opvragen

Om te beginnen maken we een bestand om het openen en bevragen van het woord insluitingen te verwerken.

touch model.py

Vervolgens voegen we de volgende regels toe model.pyom Magnitude te importeren.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

We kunnen spelen met het pymagnitudepakket en het deep learning-model door de querymethode te gebruiken en een argument voor een woord te geven.

cat_vector = vectors.query('cat')
print(cat_vector)

Voor de kern van onze API zullen we een functie definiëren om het betekenisverschil tussen twee woorden te retourneren. Dit is de ruggengraat voor de meeste deep learning-oplossingen voor zaken als aanbevelingsengines (dwz inhoud met vergelijkbare woorden weergeven).

We kunnen met deze functie spelen door de functies similarityen most_similar te gebruiken.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

We implementeren de overeenkomstcalculator als volgt. Deze methode wordt aangeroepen door de Flask API in de volgende sectie. Merk op dat deze functie een reële waarde tussen 0 en 1 retourneert.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Een REST-API maken

We zullen onze server maken in een bestand service.pymet de naam met de volgende inhoud. We importeren flasken requestverwerken onze servermogelijkheden en we importeren de similarityengine uit de module die we eerder schreven.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Onze server is nogal kaal, maar kan eenvoudig worden uitgebreid door meer routes te maken met behulp van de @app.routedecorateur.

API-aanroepen doen

We kunnen onze Flask-server uitvoeren door de volgende opdrachten uit te voeren om onze virtuele omgeving te activeren, onze pakketten te installeren en het bijbehorende Python-bestand uit te voeren.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Onze server is beschikbaar op localhost:8000. We kunnen onze database opvragen localhost:8000/similarity?word1=cat&word2=dogen de reactie bekijken in onze browser of via een andere AJAX-client.



Leave a Comment

Kan AI vechten met toenemend aantal ransomware-aanvallen?

Kan AI vechten met toenemend aantal ransomware-aanvallen?

Ransomware-aanvallen nemen toe, maar kan AI helpen het nieuwste computervirus het hoofd te bieden? Is AI het antwoord? Lees hier weten is AI boezem of vloek

ReactOS: is dit de toekomst van Windows?

ReactOS: is dit de toekomst van Windows?

ReactOS, een open source en gratis besturingssysteem is hier met de nieuwste versie. Kan het voldoen aan de behoeften van moderne Windows-gebruikers en Microsoft uitschakelen? Laten we meer te weten komen over deze oude stijl, maar een nieuwere OS-ervaring.

Blijf verbonden via WhatsApp Desktop-app 24 * 7

Blijf verbonden via WhatsApp Desktop-app 24 * 7

WhatsApp heeft eindelijk de Desktop-app voor Mac- en Windows-gebruikers gelanceerd. Nu heb je eenvoudig toegang tot WhatsApp vanuit Windows of Mac. Beschikbaar voor Windows 8+ en Mac OS 10.9+

Hoe AI procesautomatisering naar een hoger niveau kan tillen?

Hoe AI procesautomatisering naar een hoger niveau kan tillen?

Lees dit om te weten hoe kunstmatige intelligentie populair wordt onder de kleinschalige bedrijven en hoe het de kansen vergroot om ze te laten groeien en hun concurrenten voorsprong te geven.

macOS Catalina 10.15.4 Supplement Update veroorzaakt meer problemen dan het oplost

macOS Catalina 10.15.4 Supplement Update veroorzaakt meer problemen dan het oplost

Onlangs heeft Apple macOS Catalina 10.15.4 uitgebracht, een aanvullende update om problemen op te lossen, maar het lijkt erop dat de update meer problemen veroorzaakt die ertoe leiden dat mac-machines worden gemetseld. Lees dit artikel voor meer informatie

13 Commerciële data-extractietools voor big data

13 Commerciële data-extractietools voor big data

13 Commerciële data-extractietools voor big data

Wat is een logboekbestandssysteem en hoe werkt het?

Wat is een logboekbestandssysteem en hoe werkt het?

Onze computer slaat alle gegevens op een georganiseerde manier op, het zogenaamde Journaling-bestandssysteem. Het is een efficiënte methode waarmee de computer bestanden kan zoeken en weergeven zodra u op zoeken drukt.https://wethegeek.com/?p=94116&preview=true

Technologische singulariteit: een verre toekomst van de menselijke beschaving?

Technologische singulariteit: een verre toekomst van de menselijke beschaving?

Naarmate de wetenschap zich snel ontwikkelt en veel van onze inspanningen overneemt, nemen ook de risico's toe om onszelf te onderwerpen aan een onverklaarbare singulariteit. Lees, wat singulariteit voor ons kan betekenen.

Een inzicht in 26 Big Data-analysetechnieken: deel 1

Een inzicht in 26 Big Data-analysetechnieken: deel 1

Een inzicht in 26 Big Data-analysetechnieken: deel 1

De impact van kunstmatige intelligentie in de gezondheidszorg 2021

De impact van kunstmatige intelligentie in de gezondheidszorg 2021

AI in de zorg heeft de afgelopen decennia grote sprongen gemaakt. De toekomst van AI in de gezondheidszorg groeit dus nog steeds met de dag.