Hoe maak je een Deep Learning REST API met Word2Vec en Flask

Traditionele benaderingen van ontwikkeling zijn moeilijk te handhaven bij het gebruik van complexe machine learning-modellen in productie. Ontwikkeling op een laptop of lokale machine kan traag zijn om het machine learning-model te trainen voor deep learning-ingenieurs. Als gevolg hiervan maken we doorgaans gebruik van cloudmachines met krachtigere hardware om onze modellen voor machine learning zowel te trainen als uit te voeren. Dit is een goede gewoonte, omdat we complexe berekeningen abstraheren en in plaats daarvan AJAX-verzoeken indienen. In deze tutorial zullen we een vooraf opgeleid deep learning-model met de naam Word2Vec beschikbaar maken voor andere services door vanaf het begin een REST-API te bouwen.

Vereisten

  • Een Ubuntu 16.04-serverinstantie met minimaal 4 GB RAM. Voor test- en ontwikkelingsdoeleinden kunt u een exemplaar met 4 GB RAM kiezen
  • Begrijpen hoe u het Linux-besturingssysteem gebruikt om mappen en bestanden te maken / navigeren / bewerken
  • Een sudogebruiker

Wat zijn Word-insluitingen?

Inbedding van woorden is een recente ontwikkeling in natuurlijke taalverwerking en diepgaand leren die door snelle vooruitgang een revolutie teweeg heeft gebracht op beide gebieden. Woordinsluitingen zijn in wezen vectoren die elk overeenkomen met een enkel woord, zodat de vectoren de woorden betekenen. Dit kan worden aangetoond door bepaalde verschijnselen zoals de vector voor king - queen = boy - girl. Woordvectoren worden gebruikt om alles te bouwen, van aanbevelingsengines tot chatbots die de Engelse taal daadwerkelijk begrijpen.

Inbedding van woorden is niet willekeurig; ze worden gegenereerd door een neuraal netwerk te trainen. Een recente krachtige implementatie van woordintegratie komt van Google, genaamd Word2Vec, dat is getraind door woorden te voorspellen die naast andere woorden in een taal verschijnen. Voor het woord "cat"zal het neurale netwerk bijvoorbeeld de woorden "kitten"en voorspellen "feline". Deze intuïtie van woorden die naast elkaar verschijnen, stelt ons in staat ze in vectorruimte te plaatsen.

In de praktijk gebruiken we echter de voorgetrainde modellen van andere grote bedrijven zoals Google om snel prototypen te maken en implementatieprocessen te vereenvoudigen. In deze zelfstudie downloaden en gebruiken we vooraf getrainde woordinsluitingen van Word2Vec van Google. We kunnen dit doen door de volgende opdracht uit te voeren in onze werkdirectory.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

De pakketten voor flacon en magnitude installeren

Het woord embedding-model dat we hebben gedownload, heeft een .magnitudeindeling. Dit formaat stelt ons in staat om het model efficiënt te bevragen met behulp van SQL, en is daarom het optimale inbeddingsformaat voor productieservers. Omdat we het .magnitudeformaat moeten kunnen lezen , installeren we het pymagnitudepakket. We zullen ook installeren flaskom later de deep learning-voorspellingen van het model te dienen.

pip3 install pymagnitude flask

We zullen het ook toevoegen aan onze afhankelijkheidstracker met de volgende opdracht. Dit creëert een bestand met de naam requirements.txten slaat onze Python-bibliotheken op, zodat we ze later opnieuw kunnen installeren.

pip3 freeze > requirements.txt

Het Word2Vec-model opvragen

Om te beginnen maken we een bestand om het openen en bevragen van het woord insluitingen te verwerken.

touch model.py

Vervolgens voegen we de volgende regels toe model.pyom Magnitude te importeren.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

We kunnen spelen met het pymagnitudepakket en het deep learning-model door de querymethode te gebruiken en een argument voor een woord te geven.

cat_vector = vectors.query('cat')
print(cat_vector)

Voor de kern van onze API zullen we een functie definiëren om het betekenisverschil tussen twee woorden te retourneren. Dit is de ruggengraat voor de meeste deep learning-oplossingen voor zaken als aanbevelingsengines (dwz inhoud met vergelijkbare woorden weergeven).

We kunnen met deze functie spelen door de functies similarityen most_similar te gebruiken.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

We implementeren de overeenkomstcalculator als volgt. Deze methode wordt aangeroepen door de Flask API in de volgende sectie. Merk op dat deze functie een reële waarde tussen 0 en 1 retourneert.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Een REST-API maken

We zullen onze server maken in een bestand service.pymet de naam met de volgende inhoud. We importeren flasken requestverwerken onze servermogelijkheden en we importeren de similarityengine uit de module die we eerder schreven.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Onze server is nogal kaal, maar kan eenvoudig worden uitgebreid door meer routes te maken met behulp van de @app.routedecorateur.

API-aanroepen doen

We kunnen onze Flask-server uitvoeren door de volgende opdrachten uit te voeren om onze virtuele omgeving te activeren, onze pakketten te installeren en het bijbehorende Python-bestand uit te voeren.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Onze server is beschikbaar op localhost:8000. We kunnen onze database opvragen localhost:8000/similarity?word1=cat&word2=dogen de reactie bekijken in onze browser of via een andere AJAX-client.



Leave a Comment

Hoe LiteCart Shopping Cart Platform op Ubuntu 16.04 te installeren

Hoe LiteCart Shopping Cart Platform op Ubuntu 16.04 te installeren

LiteCart is een gratis en open source winkelwagenplatform geschreven in PHP, jQuery en HTML 5. Het is een eenvoudige, lichtgewicht en gebruiksvriendelijke e-commerce software

Stel NFS Share op Debian in

Stel NFS Share op Debian in

NFS is een netwerkgebaseerd bestandssysteem waarmee computers toegang hebben tot bestanden via een computernetwerk. Deze gids legt uit hoe u mappen via NF kunt weergeven

Hoe Matomo Analytics op Fedora te installeren 28

Hoe Matomo Analytics op Fedora te installeren 28

Gebruikt u een ander systeem? Matomo (voorheen Piwik) is een open source analyseplatform, een open alternatief voor Google Analytics. Matomo source wordt gehost o

Initiële veilige serverconfiguratie van Ubuntu 18.04

Initiële veilige serverconfiguratie van Ubuntu 18.04

Inleiding In deze tutorial leert u hoe u een basisbeveiligingsniveau configureert op een gloednieuwe Vultr VC2 virtuele machine met Ubunt

McMyAdmin installeren op Ubuntu 14.10

McMyAdmin installeren op Ubuntu 14.10

McMyAdmin is een Minecraft-serverbedieningspaneel dat wordt gebruikt om uw server te beheren. Hoewel McMyAdmin gratis is, zijn er meerdere edities, waarvan sommige pai zijn

Stel een TeamTalk-server in op Linux

Stel een TeamTalk-server in op Linux

TeamTalk is een conferentiesysteem waarmee gebruikers hoogwaardige audio- / videogesprekken kunnen voeren, tekstchatten, bestanden kunnen overdragen en schermen kunnen delen. Het ik

CyberPanel installeren en configureren op uw CentOS 7-server

CyberPanel installeren en configureren op uw CentOS 7-server

Gebruikt u een ander systeem? Introductie CyberPanel is een van de eerste bedieningspanelen op de markt die zowel open source is als OpenLiteSpeed ​​gebruikt. Wat thi

Ruby installeren en configureren met Rbenv, Rails, MariaDB, Nginx, SSL en Passenger op Ubuntu 17.04

Ruby installeren en configureren met Rbenv, Rails, MariaDB, Nginx, SSL en Passenger op Ubuntu 17.04

Ruby on Rails is een populair webraamwerk voor Ruby dat is ontwikkeld om de productiviteit van programmeurs te verhogen. Het verkrijgen van verschillende edelstenen en afhankelijkheden t

Sensu Monitoring installeren en configureren op CentOS 7

Sensu Monitoring installeren en configureren op CentOS 7

Introductie Sensu is een gratis en open source monitoringoplossing die kan worden gebruikt om server, applicatie en verschillende systeemservices te monitoren. Sensu i

Installeer phpBB With Apache op Ubuntu 16.04

Installeer phpBB With Apache op Ubuntu 16.04

PhpBB is een open source prikbordprogramma. Dit artikel laat zien hoe je phpBB bovenop een Apache-webserver op Ubuntu 16.04 installeert. Het was geschreven

Stel een niet-rootgebruiker in met Sudo Access op Ubuntu

Stel een niet-rootgebruiker in met Sudo Access op Ubuntu

Slechts één gebruiker, root, kan gevaarlijk zijn. Dus laten we dat oplossen. Vultr geeft ons de vrijheid om te doen wat we willen met onze gebruikers en onze servers

Toegang krijgen tot uw Vultr VPS

Toegang krijgen tot uw Vultr VPS

Vultr biedt verschillende manieren om toegang te krijgen tot je VPS om te configureren, installeren en gebruiken. Toegangsgegevens De standaard toegangsgegevens voor uw VPS-ar

Fuel CMS installeren op Ubuntu 16.04 LTS

Fuel CMS installeren op Ubuntu 16.04 LTS

Gebruikt u een ander systeem? Fuel CMS is een op CodeIgniter gebaseerd contentmanagementsysteem. De broncode wordt gehost op GitHub. Deze gids laat zien hoe t

Remote Servers bewaken met Zabbix op Ubuntu 16.04

Remote Servers bewaken met Zabbix op Ubuntu 16.04

Gebruikt u een ander systeem? Zabbix is ​​een gratis en open source enterprise-ready software die wordt gebruikt om de beschikbaarheid van systemen en netwerkcomponenten te bewaken

Couch CMS 2.0 installeren op een Debian 9 LAMP VPS

Couch CMS 2.0 installeren op een Debian 9 LAMP VPS

Gebruikt u een ander systeem? Couch CMS is een eenvoudig en flexibel, gratis en open source Content Management Systeem (CMS) waarmee webdesigners kunnen ontwerpen

Golang 1.8.3 installeren op CentOS 7, Ubuntu 16.04 en Debian 9

Golang 1.8.3 installeren op CentOS 7, Ubuntu 16.04 en Debian 9

Golang is een door Google ontwikkelde programmeertaal. Dankzij zijn veelzijdigheid, eenvoud en betrouwbaarheid is Golang uitgegroeid tot een van de meest bevolkte

Quassel instellen op Debian 9

Quassel instellen op Debian 9

IRC is populair bij ontwikkelaars en gebruikers van open source software. Een van de nadelen van IRC is dat wanneer u niet online bent, u importan kunt missen

Sudo gebruiken op Debian, CentOS en FreeBSD

Sudo gebruiken op Debian, CentOS en FreeBSD

Het gebruik van een sudo-gebruiker om toegang te krijgen tot een server en opdrachten uit te voeren op rootniveau is een veel voorkomende praktijk onder Linux en Unix-systeembeheerder. Het gebruik van een sud

Hoe DokuWiki op Ubuntu 16.04 LTS te installeren

Hoe DokuWiki op Ubuntu 16.04 LTS te installeren

Gebruikt u een ander systeem? DokuWiki is een open source wiki-programma geschreven in PHP waarvoor geen database nodig is. Het slaat gegevens op in tekstbestanden. DokuWik

Een Chroot opzetten op Debian

Een Chroot opzetten op Debian

Dit artikel leert u hoe u een chroot-gevangenis op Debian instelt. Ik neem aan dat u Debian 7.x gebruikt. Als u Debian 6 of 8 gebruikt, kan dit werken, bu

Kan AI vechten met toenemend aantal ransomware-aanvallen?

Kan AI vechten met toenemend aantal ransomware-aanvallen?

Ransomware-aanvallen nemen toe, maar kan AI helpen het nieuwste computervirus het hoofd te bieden? Is AI het antwoord? Lees hier weten is AI boezem of vloek

ReactOS: is dit de toekomst van Windows?

ReactOS: is dit de toekomst van Windows?

ReactOS, een open source en gratis besturingssysteem is hier met de nieuwste versie. Kan het voldoen aan de behoeften van moderne Windows-gebruikers en Microsoft uitschakelen? Laten we meer te weten komen over deze oude stijl, maar een nieuwere OS-ervaring.

Blijf verbonden via WhatsApp Desktop-app 24 * 7

Blijf verbonden via WhatsApp Desktop-app 24 * 7

WhatsApp heeft eindelijk de Desktop-app voor Mac- en Windows-gebruikers gelanceerd. Nu heb je eenvoudig toegang tot WhatsApp vanuit Windows of Mac. Beschikbaar voor Windows 8+ en Mac OS 10.9+

Hoe AI procesautomatisering naar een hoger niveau kan tillen?

Hoe AI procesautomatisering naar een hoger niveau kan tillen?

Lees dit om te weten hoe kunstmatige intelligentie populair wordt onder de kleinschalige bedrijven en hoe het de kansen vergroot om ze te laten groeien en hun concurrenten voorsprong te geven.

macOS Catalina 10.15.4 Supplement Update veroorzaakt meer problemen dan het oplost

macOS Catalina 10.15.4 Supplement Update veroorzaakt meer problemen dan het oplost

Onlangs heeft Apple macOS Catalina 10.15.4 uitgebracht, een aanvullende update om problemen op te lossen, maar het lijkt erop dat de update meer problemen veroorzaakt die ertoe leiden dat mac-machines worden gemetseld. Lees dit artikel voor meer informatie

13 Commerciële data-extractietools voor big data

13 Commerciële data-extractietools voor big data

13 Commerciële data-extractietools voor big data

Wat is een logboekbestandssysteem en hoe werkt het?

Wat is een logboekbestandssysteem en hoe werkt het?

Onze computer slaat alle gegevens op een georganiseerde manier op, het zogenaamde Journaling-bestandssysteem. Het is een efficiënte methode waarmee de computer bestanden kan zoeken en weergeven zodra u op zoeken drukt.https://wethegeek.com/?p=94116&preview=true

Technologische singulariteit: een verre toekomst van de menselijke beschaving?

Technologische singulariteit: een verre toekomst van de menselijke beschaving?

Naarmate de wetenschap zich snel ontwikkelt en veel van onze inspanningen overneemt, nemen ook de risico's toe om onszelf te onderwerpen aan een onverklaarbare singulariteit. Lees, wat singulariteit voor ons kan betekenen.

Een inzicht in 26 Big Data-analysetechnieken: deel 1

Een inzicht in 26 Big Data-analysetechnieken: deel 1

Een inzicht in 26 Big Data-analysetechnieken: deel 1

De impact van kunstmatige intelligentie in de gezondheidszorg 2021

De impact van kunstmatige intelligentie in de gezondheidszorg 2021

AI in de zorg heeft de afgelopen decennia grote sprongen gemaakt. De toekomst van AI in de gezondheidszorg groeit dus nog steeds met de dag.