So installieren Sie MODX Revolution auf einem CentOS 7 LAMP VPS
Verwenden Sie ein anderes System? MODX Revolution ist ein schnelles, flexibles, skalierbares, kostenloses und Open-Source-Content-Management-System (CMS) für Unternehmen, das i
Traditionelle Entwicklungsansätze sind schwer beizubehalten, wenn komplexe Modelle des maschinellen Lernens in der Produktion verwendet werden. Die Entwicklung auf einem Laptop oder einer lokalen Maschine kann langsam sein, um das Modell des maschinellen Lernens für Deep-Learning-Ingenieure zu trainieren. Daher verwenden wir normalerweise Cloud-Maschinen mit leistungsfähigerer Hardware, um unsere Modelle für maschinelles Lernen zu trainieren und auszuführen. Dies ist eine gute Vorgehensweise, da wir komplexe Berechnungen abstrahieren und stattdessen nach Bedarf AJAX-Anforderungen stellen. In diesem Tutorial stellen wir anderen Diensten ein vorab geschultes Deep-Learning-Modell mit dem Namen Word2Vec zur Verfügung, indem wir eine REST-API von Grund auf erstellen.
sudo
BenutzerWorteinbettungen sind eine jüngste Entwicklung in der Verarbeitung natürlicher Sprache und im Deep Learning, die beide Bereiche aufgrund des schnellen Fortschritts revolutioniert hat. Worteinbettungen sind im Wesentlichen Vektoren, die jeweils einem einzelnen Wort entsprechen, so dass die Vektoren die Wörter bedeuten. Dies kann durch bestimmte Phänomene wie den Vektor für demonstriert werden king - queen = boy - girl
. Wortvektoren werden verwendet, um alles zu erstellen, von Empfehlungs-Engines bis hin zu Chat-Bots, die die englische Sprache tatsächlich verstehen.
Worteinbettungen sind nicht zufällig. Sie werden durch Training eines neuronalen Netzwerks erzeugt. Eine kürzlich durchgeführte leistungsstarke Implementierung zum Einbetten von Wörtern stammt von Google mit dem Namen Word2Vec, die durch Vorhersagen von Wörtern trainiert wird, die neben anderen Wörtern in einer Sprache erscheinen. Zum Beispiel wird "cat"
das neuronale Netzwerk für das Wort die Wörter "kitten"
und vorhersagen "feline"
. Diese Intuition von Wörtern, die nahe beieinander erscheinen, ermöglicht es uns, sie im Vektorraum zu platzieren.
In der Praxis tendieren wir jedoch dazu, die vorgefertigten Modelle anderer großer Unternehmen wie Google zu verwenden, um schnell Prototypen zu erstellen und Bereitstellungsprozesse zu vereinfachen. In diesem Tutorial werden die vorgefertigten Worteinbettungen von Google Word2Vec heruntergeladen und verwendet. Wir können dies tun, indem wir den folgenden Befehl in unserem Arbeitsverzeichnis ausführen.
wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude
Das von uns heruntergeladene Worteinbettungsmodell hat ein .magnitude
Format. Dieses Format ermöglicht es uns, das Modell mithilfe von SQL effizient abzufragen, und ist daher das optimale Einbettungsformat für Produktionsserver. Da wir das .magnitude
Format lesen können müssen , installieren wir das pymagnitude
Paket. Wir werden auch installieren, flask
um später die vom Modell gemachten Deep-Learning-Vorhersagen zu unterstützen.
pip3 install pymagnitude flask
Wir werden es auch mit dem folgenden Befehl zu unserem Abhängigkeits-Tracker hinzufügen. Dadurch wird eine Datei mit dem Namen erstellt requirements.txt
und unsere Python-Bibliotheken gespeichert, damit wir sie zu einem späteren Zeitpunkt erneut installieren können.
pip3 freeze > requirements.txt
Zunächst erstellen wir eine Datei zum Öffnen und Abfragen der Worteinbettungen.
touch model.py
Als Nächstes fügen wir die folgenden Zeilen hinzu model.py
, um Magnitude zu importieren.
from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')
Wir können mit dem pymagnitude
Paket und dem Deep-Learning-Modell query
herumspielen, indem wir die Methode verwenden und ein Argument für ein Wort liefern.
cat_vector = vectors.query('cat')
print(cat_vector)
Für den Kern unserer API definieren wir eine Funktion, um den Bedeutungsunterschied zwischen zwei Wörtern zurückzugeben. Dies ist das Rückgrat für die meisten Deep-Learning-Lösungen für Dinge wie Empfehlungs-Engines (dh Anzeigen von Inhalten mit ähnlichen Wörtern).
Wir können mit dieser Funktion herumspielen, indem wir die Funktionen similarity
und most_similar
verwenden.
print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))
Wir implementieren den Ähnlichkeitsrechner wie folgt. Diese Methode wird von der Flask-API im nächsten Abschnitt aufgerufen. Beachten Sie, dass diese Funktion einen reellen Wert zwischen 0 und 1 zurückgibt.
def similarity(word1, word2):
return vectors.similarity(word1, word2)
Wir erstellen unseren Server in einer Datei service.py
mit dem folgenden Inhalt. Wir importieren flask
und verwalten request
unsere Serverfunktionen und importieren die similarity
Engine aus dem Modul, das wir zuvor geschrieben haben.
from flask import Flask, request
from model import similarity
app = Flask(__name__)
@app.route("/", methods=['GET'])
def welcome():
return "Welcome to our Machine Learning REST API!"
@app.route("/similarity", methods=['GET'])
def similarity_route():
word1 = request.args.get("word1")
word2 = request.args.get("word2")
return str(similarity(word1, word2))
if __name__ == "__main__":
app.run(port=8000, debug=True)
Unser Server ist ziemlich einfach, kann aber leicht erweitert werden, indem mit dem @app.route
Dekorator mehr Routen erstellt werden .
Wir können unseren Flask-Server ausführen, indem wir die folgenden Befehle ausführen, um unsere virtuelle Umgebung zu aktivieren, unsere Pakete zu installieren und die zugehörige Python-Datei auszuführen.
source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py
Unser Server wird verfügbar sein unter localhost:8000
. Wir können unsere Datenbank unter abfragen localhost:8000/similarity?word1=cat&word2=dog
und die Antwort entweder in unserem Browser oder über einen anderen AJAX-Client anzeigen.
Verwenden Sie ein anderes System? MODX Revolution ist ein schnelles, flexibles, skalierbares, kostenloses und Open-Source-Content-Management-System (CMS) für Unternehmen, das i
McMyAdmin ist ein Minecraft-Server-Kontrollfeld, mit dem Sie Ihren Server verwalten können. Obwohl McMyAdmin kostenlos ist, gibt es mehrere Editionen, von denen einige pai sind
TeamTalk ist ein Konferenzsystem, mit dem Benutzer hochwertige Audio- / Videogespräche führen, Text chatten, Dateien übertragen und Bildschirme freigeben können. Es i
Verwenden Sie ein anderes System? Einführung CyberPanel ist eines der ersten Control Panels auf dem Markt, das sowohl Open Source als auch OpenLiteSpeed verwendet. Was ist das?
PhpBB ist ein Open Source Bulletin Board Programm. Dieser Artikel zeigt Ihnen, wie Sie phpBB auf einem Apache-Webserver unter Ubuntu 16.04 installieren. Es wurde geschrieben
Es kann gefährlich sein, nur einen Benutzer zu haben, nämlich root. Lassen Sie uns das beheben. Vultr bietet uns die Freiheit, mit unseren Benutzern und unseren Servern zu tun, was wir wollen
Verwenden Sie ein anderes System? ESpeak kann TTS-Audiodateien (Text-to-Speech) generieren. Diese können aus vielen Gründen nützlich sein, z. B. um Ihr eigenes Turin zu erstellen
Verwenden Sie ein anderes System? Thelia ist ein Open-Source-Tool zum Erstellen von E-Business-Websites und zum Verwalten von Online-Inhalten, die in PHP geschrieben wurden. Thelia Quellcode i
Verwenden Sie ein anderes System? Fuel CMS ist ein CodeIgniter-basiertes Content-Management-System. Der Quellcode wird auf GitHub gehostet. Diese Anleitung zeigt Ihnen, wie t
Dieses Tutorial führt Sie durch die Installation des Yunohost Complete Server-Kontrollfelds unter Debian. Folgen Sie einfach dem Tutorial und Ihr Server wird in Betrieb sein
Cockpit ist ein kostenloses Open Source-Programm für die Linux-Serververwaltung. Es ist sehr leicht und hat eine schöne, einfach zu bedienende Weboberfläche. Es erlaubt System
Gollum ist die Git-basierte Wiki-Software, die als Backend des GitHub-Wikis verwendet wird. Durch die Bereitstellung von Gollum können Sie ein GitHub-ähnliches Wiki-System auf Ihnen hosten
Einführung Haben Sie Probleme mit der Konnektivität, wenn Besucher aus anderen Ländern auf Ihre Website zugreifen? Ich frage mich, warum die Download-Geschwindigkeit von Ihrem Foreig
Verwenden Sie ein anderes System? Gitea ist ein alternatives Open-Source-Versionskontrollsystem, das von Git unterstützt wird. Gitea ist in Golang geschrieben und ist
Verwenden Sie ein anderes System? Ghost ist eine Open-Source-Blogging-Plattform, die seit 201 bei Entwicklern und normalen Benutzern immer beliebter wird
Verwenden Sie ein anderes System? Paste 2.1 ist eine einfache und flexible, kostenlose und Open-Source-Pastebin-Anwendung zum Speichern von Code, Text und mehr. Es war ursprünglich
Pip ist ein Tool zum Verwalten von Python-Paketen. Die Verwendung eines Paketmanagers ermöglicht eine effiziente Verwaltung Ihres Servers. In diesem Tutorial erkläre ich, wie t
BBR (Bottleneck Bandwidth and RTT) ist ein neuer Algorithmus zur Überlastungskontrolle, der von Google zum Linux-Kernel-TCP-Stack hinzugefügt wird. Mit BBR an Ort und Stelle,
YOURLS (Your Own URL Shortener) ist eine Open-Source-Anwendung zur URL-Verkürzung und Datenanalyse. In diesem Artikel werden wir den Installationsprozess behandeln
Verwenden Sie ein anderes System? TLS 1.3 ist eine Version des TLS-Protokolls (Transport Layer Security), das 2018 als vorgeschlagener Standard in RFC 8446 veröffentlicht wurde
Ransomware-Angriffe nehmen zu, aber kann KI helfen, den neuesten Computervirus zu bekämpfen? Ist KI die Antwort? Lesen Sie hier, ob KI boone oder bane ist
ReactOS, ein quelloffenes und kostenloses Betriebssystem, ist hier mit der neuesten Version. Kann es den Anforderungen moderner Windows-Benutzer genügen und Microsoft zu Fall bringen? Lassen Sie uns mehr über dieses alte, aber neuere Betriebssystem erfahren.
Whatsapp hat endlich die Desktop-App für Mac- und Windows-Benutzer auf den Markt gebracht. Jetzt können Sie ganz einfach von Windows oder Mac auf WhatsApp zugreifen. Verfügbar für Windows 8+ und Mac OS 10.9+
Lesen Sie dies, um zu erfahren, wie Künstliche Intelligenz bei kleinen Unternehmen beliebt wird und wie sie die Wahrscheinlichkeit erhöht, sie wachsen zu lassen und ihren Konkurrenten einen Vorsprung zu verschaffen.
Vor kurzem hat Apple macOS Catalina 10.15.4 als Ergänzungsupdate veröffentlicht, um Probleme zu beheben, aber es scheint, dass das Update mehr Probleme verursacht, die zum Bricking von Mac-Computern führen. Lesen Sie diesen Artikel, um mehr zu erfahren
13 Tools zur kommerziellen Datenextraktion von Big Data
Unser Computer speichert alle Daten in einer organisierten Weise, die als Journaling-Dateisystem bekannt ist. Es ist eine effiziente Methode, die es dem Computer ermöglicht, Dateien zu suchen und anzuzeigen, sobald Sie auf die Suche klicken.https://wethegeek.com/?p=94116&preview=true
Da sich die Wissenschaft schnell weiterentwickelt und einen Großteil unserer Bemühungen übernimmt, steigt auch das Risiko, uns einer unerklärlichen Singularität auszusetzen. Lesen Sie, was Singularität für uns bedeuten könnte.
Ein Einblick in 26 Big-Data-Analysetechniken: Teil 1
KI im Gesundheitswesen hat in den letzten Jahrzehnten große Fortschritte gemacht. Somit wächst die Zukunft der KI im Gesundheitswesen immer noch von Tag zu Tag.