So erstellen Sie eine Deep Learning-REST-API mit Word2Vec und Flask

Voraussetzungen
Was sind Worteinbettungen?
Installieren der Flaschen- und Größenpakete
Abfragen des Word2Vec-Modells
Erstellen einer REST-API
API-Aufrufe tätigen

Traditionelle Entwicklungsansätze sind schwer beizubehalten, wenn komplexe Modelle des maschinellen Lernens in der Produktion verwendet werden. Die Entwicklung auf einem Laptop oder einer lokalen Maschine kann langsam sein, um das Modell des maschinellen Lernens für Deep-Learning-Ingenieure zu trainieren. Daher verwenden wir normalerweise Cloud-Maschinen mit leistungsfähigerer Hardware, um unsere Modelle für maschinelles Lernen zu trainieren und auszuführen. Dies ist eine gute Vorgehensweise, da wir komplexe Berechnungen abstrahieren und stattdessen nach Bedarf AJAX-Anforderungen stellen. In diesem Tutorial stellen wir anderen Diensten ein vorab geschultes Deep-Learning-Modell mit dem Namen Word2Vec zur Verfügung, indem wir eine REST-API von Grund auf erstellen.

Voraussetzungen

Eine Ubuntu 16.04-Serverinstanz mit mindestens 4 GB RAM. Zu Test- und Entwicklungszwecken können Sie eine Instanz mit 4 GB RAM auswählen
Grundlegendes zur Verwendung des Linux-Betriebssystems zum Erstellen / Navigieren / Bearbeiten von Ordnern und Dateien
Ein sudoBenutzer

Was sind Worteinbettungen?

Worteinbettungen sind eine jüngste Entwicklung in der Verarbeitung natürlicher Sprache und im Deep Learning, die beide Bereiche aufgrund des schnellen Fortschritts revolutioniert hat. Worteinbettungen sind im Wesentlichen Vektoren, die jeweils einem einzelnen Wort entsprechen, so dass die Vektoren die Wörter bedeuten. Dies kann durch bestimmte Phänomene wie den Vektor für demonstriert werden king - queen = boy - girl. Wortvektoren werden verwendet, um alles zu erstellen, von Empfehlungs-Engines bis hin zu Chat-Bots, die die englische Sprache tatsächlich verstehen.

Worteinbettungen sind nicht zufällig. Sie werden durch Training eines neuronalen Netzwerks erzeugt. Eine kürzlich durchgeführte leistungsstarke Implementierung zum Einbetten von Wörtern stammt von Google mit dem Namen Word2Vec, die durch Vorhersagen von Wörtern trainiert wird, die neben anderen Wörtern in einer Sprache erscheinen. Zum Beispiel wird "cat"das neuronale Netzwerk für das Wort die Wörter "kitten"und vorhersagen "feline". Diese Intuition von Wörtern, die nahe beieinander erscheinen, ermöglicht es uns, sie im Vektorraum zu platzieren.

In der Praxis tendieren wir jedoch dazu, die vorgefertigten Modelle anderer großer Unternehmen wie Google zu verwenden, um schnell Prototypen zu erstellen und Bereitstellungsprozesse zu vereinfachen. In diesem Tutorial werden die vorgefertigten Worteinbettungen von Google Word2Vec heruntergeladen und verwendet. Wir können dies tun, indem wir den folgenden Befehl in unserem Arbeitsverzeichnis ausführen.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Installieren der Flaschen- und Größenpakete

Das von uns heruntergeladene Worteinbettungsmodell hat ein .magnitudeFormat. Dieses Format ermöglicht es uns, das Modell mithilfe von SQL effizient abzufragen, und ist daher das optimale Einbettungsformat für Produktionsserver. Da wir das .magnitudeFormat lesen können müssen , installieren wir das pymagnitudePaket. Wir werden auch installieren, flaskum später die vom Modell gemachten Deep-Learning-Vorhersagen zu unterstützen.

pip3 install pymagnitude flask

Wir werden es auch mit dem folgenden Befehl zu unserem Abhängigkeits-Tracker hinzufügen. Dadurch wird eine Datei mit dem Namen erstellt requirements.txtund unsere Python-Bibliotheken gespeichert, damit wir sie zu einem späteren Zeitpunkt erneut installieren können.

pip3 freeze > requirements.txt

Abfragen des Word2Vec-Modells

Zunächst erstellen wir eine Datei zum Öffnen und Abfragen der Worteinbettungen.

touch model.py

Als Nächstes fügen wir die folgenden Zeilen hinzu model.py, um Magnitude zu importieren.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Wir können mit dem pymagnitudePaket und dem Deep-Learning-Modell queryherumspielen, indem wir die Methode verwenden und ein Argument für ein Wort liefern.

cat_vector = vectors.query('cat')
print(cat_vector)

Für den Kern unserer API definieren wir eine Funktion, um den Bedeutungsunterschied zwischen zwei Wörtern zurückzugeben. Dies ist das Rückgrat für die meisten Deep-Learning-Lösungen für Dinge wie Empfehlungs-Engines (dh Anzeigen von Inhalten mit ähnlichen Wörtern).

Wir können mit dieser Funktion herumspielen, indem wir die Funktionen similarityund most_similar verwenden.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Wir implementieren den Ähnlichkeitsrechner wie folgt. Diese Methode wird von der Flask-API im nächsten Abschnitt aufgerufen. Beachten Sie, dass diese Funktion einen reellen Wert zwischen 0 und 1 zurückgibt.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Erstellen einer REST-API

Wir erstellen unseren Server in einer Datei service.pymit dem folgenden Inhalt. Wir importieren flaskund verwalten requestunsere Serverfunktionen und importieren die similarityEngine aus dem Modul, das wir zuvor geschrieben haben.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Unser Server ist ziemlich einfach, kann aber leicht erweitert werden, indem mit dem @app.routeDekorator mehr Routen erstellt werden .

API-Aufrufe tätigen

Wir können unseren Flask-Server ausführen, indem wir die folgenden Befehle ausführen, um unsere virtuelle Umgebung zu aktivieren, unsere Pakete zu installieren und die zugehörige Python-Datei auszuführen.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Unser Server wird verfügbar sein unter localhost:8000. Wir können unsere Datenbank unter abfragen localhost:8000/similarity?word1=cat&word2=dogund die Antwort entweder in unserem Browser oder über einen anderen AJAX-Client anzeigen.

Einen Kommentar hinterlassen

Kommentar *

Name *

Website

Kann KI mit zunehmender Anzahl von Ransomware-Angriffen kämpfen?

Ransomware-Angriffe nehmen zu, aber kann KI helfen, den neuesten Computervirus zu bekämpfen? Ist KI die Antwort? Lesen Sie hier, ob KI boone oder bane ist

ReactOS: Ist das die Zukunft von Windows?

ReactOS, ein quelloffenes und kostenloses Betriebssystem, ist hier mit der neuesten Version. Kann es den Anforderungen moderner Windows-Benutzer genügen und Microsoft zu Fall bringen? Lassen Sie uns mehr über dieses alte, aber neuere Betriebssystem erfahren.

Bleiben Sie in Verbindung über die WhatsApp Desktop App 24*7

Whatsapp hat endlich die Desktop-App für Mac- und Windows-Benutzer auf den Markt gebracht. Jetzt können Sie ganz einfach von Windows oder Mac auf WhatsApp zugreifen. Verfügbar für Windows 8+ und Mac OS 10.9+

Wie kann KI die Prozessautomatisierung auf die nächste Stufe heben?

Lesen Sie dies, um zu erfahren, wie Künstliche Intelligenz bei kleinen Unternehmen beliebt wird und wie sie die Wahrscheinlichkeit erhöht, sie wachsen zu lassen und ihren Konkurrenten einen Vorsprung zu verschaffen.

macOS Catalina 10.15.4 Supplement Update verursacht mehr Probleme als sie zu lösen

Vor kurzem hat Apple macOS Catalina 10.15.4 als Ergänzungsupdate veröffentlicht, um Probleme zu beheben, aber es scheint, dass das Update mehr Probleme verursacht, die zum Bricking von Mac-Computern führen. Lesen Sie diesen Artikel, um mehr zu erfahren

13 Tools zur kommerziellen Datenextraktion von Big Data

Was ist ein Journaling-Dateisystem und wie funktioniert es?

Unser Computer speichert alle Daten in einer organisierten Weise, die als Journaling-Dateisystem bekannt ist. Es ist eine effiziente Methode, die es dem Computer ermöglicht, Dateien zu suchen und anzuzeigen, sobald Sie auf die Suche klicken.https://wethegeek.com/?p=94116&preview=true

Technologische Singularität: Eine ferne Zukunft der menschlichen Zivilisation?

Da sich die Wissenschaft schnell weiterentwickelt und einen Großteil unserer Bemühungen übernimmt, steigt auch das Risiko, uns einer unerklärlichen Singularität auszusetzen. Lesen Sie, was Singularität für uns bedeuten könnte.

Ein Einblick in 26 Big-Data-Analysetechniken: Teil 1

Der Einfluss künstlicher Intelligenz im Gesundheitswesen 2021

KI im Gesundheitswesen hat in den letzten Jahrzehnten große Fortschritte gemacht. Somit wächst die Zukunft der KI im Gesundheitswesen immer noch von Tag zu Tag.