Come creare unAPI REST di deep learning con Word2Vec e Flask

Prerequisiti
Cosa sono gli incantesimi di parole?
Installazione dei pacchetti pallone e magnitudo
Interrogazione del modello Word2Vec
Creazione di un'API REST
Effettuare chiamate API

Gli approcci tradizionali allo sviluppo sono difficili da mantenere quando si utilizzano modelli di apprendimento automatico complessi in produzione. Lo sviluppo su un laptop o una macchina locale può essere lento per addestrare il modello di machine learning per gli ingegneri del deep learning. Di conseguenza, in genere utilizziamo macchine cloud con hardware più potente per addestrare ed eseguire i nostri modelli di apprendimento automatico. Questa è una buona pratica poiché astraggiamo un calcolo complesso e facciamo invece richieste AJAX come necessario. In questo tutorial, renderemo disponibile un modello di apprendimento approfondito pre-addestrato chiamato Word2Vec per altri servizi creando un'API REST da zero.

Prerequisiti

Un'istanza del server Ubuntu 16.04 con almeno 4 GB di RAM. A scopo di test e sviluppo, è possibile scegliere un'istanza con 4 GB di RAM
Comprensione di come utilizzare il sistema operativo Linux per creare / navigare / modificare cartelle e file
Un sudoutente

Cosa sono gli incantesimi di parole?

Gli incorporamenti di parole sono uno sviluppo recente nell'elaborazione del linguaggio naturale e nell'apprendimento profondo che ha rivoluzionato entrambi i campi a causa dei rapidi progressi. Gli incorporamenti di parole sono essenzialmente vettori che corrispondono ciascuno a una singola parola in modo tale che i vettori intendono le parole. Questo può essere dimostrato da alcuni fenomeni come il vettore per king - queen = boy - girl. I vettori di parole vengono utilizzati per costruire qualsiasi cosa, dai motori di raccomandazione ai chat-bot che comprendono effettivamente la lingua inglese.

Gli incorporamenti di parole non sono casuali; sono generati allenando una rete neurale. Una recente e potente implementazione dell'incorporamento di parole proviene da Google denominata Word2Vec, che viene addestrata predicendo le parole che appaiono accanto ad altre parole in una lingua. Ad esempio, per la parola "cat", la rete neurale predirà le parole "kitten"e "feline". Questa intuizione delle parole che appaiono una accanto all'altra ci consente di posizionarle nello spazio vettoriale.

Tuttavia, in pratica, tendiamo a utilizzare i modelli pre-addestrati di altre grandi aziende come Google per prototipare rapidamente e semplificare i processi di implementazione. In questo tutorial scaricheremo e utilizzeremo gli incorporamenti di parole pre-addestrate di Word2Vec di Google. Possiamo farlo eseguendo il seguente comando nella nostra directory di lavoro.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Installazione dei pacchetti pallone e magnitudo

Il modello di incorporamento delle parole che abbiamo scaricato è in un .magnitudeformato. Questo formato ci consente di interrogare il modello in modo efficiente utilizzando SQL ed è quindi il formato di incorporamento ottimale per i server di produzione. Dato che dobbiamo essere in grado di leggere il .magnitudeformato, installeremo il pymagnitudepacchetto. Installeremo anche flaskper servire successivamente le previsioni di deep learning fatte dal modello.

pip3 install pymagnitude flask

Lo aggiungeremo anche al nostro tracker di dipendenze con il seguente comando. Questo crea un file chiamato requirements.txte salva le nostre librerie Python in modo da poterle reinstallare in un secondo momento.

pip3 freeze > requirements.txt

Interrogazione del modello Word2Vec

Per iniziare, creeremo un file per gestire l'apertura e l'interrogazione delle parole incorporamenti.

touch model.py

Successivamente, aggiungeremo le seguenti righe model.pyper importare Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Possiamo giocare con il pymagnitudepacchetto e il modello di apprendimento profondo usando il querymetodo, fornendo un argomento per una parola.

cat_vector = vectors.query('cat')
print(cat_vector)

Per il nucleo della nostra API, definiremo una funzione per restituire la differenza di significato tra due parole. Questa è la spina dorsale per la maggior parte delle soluzioni di deep learning per cose come i motori di raccomandazione (ovvero mostrare contenuti con parole simili).

Possiamo giocare con questa funzione usando le funzioni similaritye most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Implementiamo il calcolatore di somiglianza come segue. Questo metodo verrà chiamato dall'API Flask nella sezione successiva. Si noti che questa funzione restituisce un valore reale compreso tra 0 e 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Creazione di un'API REST

Creeremo il nostro server in un file denominato service.pycon i seguenti contenuti. Importiamo flaske requestgestiamo le funzionalità del nostro server e importiamo il similaritymotore dal modulo che abbiamo scritto in precedenza.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Il nostro server è piuttosto semplice, ma può essere facilmente esteso creando più percorsi utilizzando il @app.routedecoratore.

Effettuare chiamate API

Possiamo eseguire il nostro server Flask eseguendo i seguenti comandi per attivare il nostro ambiente virtuale, installare i nostri pacchetti ed eseguire il file Python associato.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Il nostro server sarà disponibile all'indirizzo localhost:8000. Possiamo interrogare il nostro database localhost:8000/similarity?word1=cat&word2=doge visualizzare la risposta nel nostro browser o tramite un altro client AJAX.

Tags: #Linux Guides #Machine Learning #Programming #Python

Comment *

Name *

Website

Come installare la piattaforma del carrello LiteCart su Ubuntu 16.04

LiteCart è una piattaforma di carrello degli acquisti gratuita e open source scritta in PHP, jQuery e HTML 5. È un software di e-commerce semplice, leggero e facile da usare

Installa la condivisione NFS su Debian

NFS è un file system basato su rete che consente ai computer di accedere ai file attraverso una rete di computer. Questa guida spiega come esporre le cartelle su NF

Configurazione iniziale del server sicuro di Ubuntu 18.04

Introduzione Durante questo tutorial imparerai come configurare un livello base di sicurezza su una nuovissima macchina virtuale Vultr VC2 che esegue Ubunt

Installazione di McMyAdmin su Ubuntu 14.10

McMyAdmin è un pannello di controllo del server Minecraft utilizzato per amministrare il tuo server. Sebbene McMyAdmin sia gratuito, ci sono più edizioni, alcune delle quali sono pai

Installa un TeamTalk Server su Linux

TeamTalk è un sistema di conferenza che consente agli utenti di avere conversazioni audio / video di alta qualità, chat di testo, trasferire file e condividere schermate. Io

Come installare e configurare CyberPanel sul server CentOS 7

Usi un sistema diverso? Introduzione CyberPanel è uno dei primi pannelli di controllo sul mercato che è sia open source che utilizza OpenLiteSpeed. Che cosa

Come installare e configurare Sensu Monitoring su CentOS 7

Introduzione Sensu è una soluzione di monitoraggio gratuita e open source che può essere utilizzata per monitorare server, applicazioni e vari servizi di sistema. Sensu i

Installa phpBB con Apache su Ubuntu 16.04

PhpBB è un programma di bacheca open source. Questo articolo ti mostrerà come installare phpBB su un server web Apache su Ubuntu 16.04. Era scritto

Installa un utente non root con accesso Sudo su Ubuntu

Avere un solo utente, che è root, può essere pericoloso. Quindi risolviamolo. Vultr ci offre la libertà di fare ciò che vogliamo con i nostri utenti e i nostri server

Come accedere al VPS Vultr

Vultr offre diversi modi per accedere al tuo VPS per configurare, installare e utilizzare. Credenziali di accesso Le credenziali di accesso predefinite per il tuo VPS ar

Installazione di Fuel CMS su Ubuntu 16.04 LTS

Usi un sistema diverso? Fuel CMS è un sistema di gestione dei contenuti basato su CodeIgniter. Il suo codice sorgente è ospitato su GitHub. Questa guida ti mostrerà come t

Come installare Couch CMS 2.0 su un VPS Debian 9 LAMP

Usi un sistema diverso? Couch CMS è un sistema di gestione dei contenuti (CMS) semplice e flessibile, gratuito e open source che consente ai web designer di progettare

Come installare Golang 1.8.3 su CentOS 7, Ubuntu 16.04 e Debian 9

Golang è un linguaggio di programmazione sviluppato da Google. Grazie alla sua versatilità, semplicità e affidabilità, Golang è diventato uno dei più popolari

Come installare OpenMeetings su CentOS 7

Usi un sistema diverso? Apache OpenMeetings è unapplicazione per conferenze Web open source. È scritto in Java e supporta più server di database. io

Come installare Quassel su Debian 9

IRC è popolare tra gli sviluppatori e gli utenti di software open source. Uno degli svantaggi di IRC è quando non sei in linea, potresti perdere Importan

Come usare Sudo su Debian, CentOS e FreeBSD

Luso di un utente sudo per accedere a un server ed eseguire comandi a livello di root è una pratica molto comune tra Linux e Unix Systems Administrator. Luso di un sud

Come installare RabbitMQ su CentOS 7

Usando un sistema diverso? RabbitMQ è un broker di messaggi open source ampiamente utilizzato scritto nel linguaggio di programmazione Erlang. Come middleware orientato ai messaggi

Come abilitare TLS 1.3 in Apache su Fedora 30

Usi un sistema diverso? TLS 1.3 è una versione del protocollo TLS (Transport Layer Security) che è stato pubblicato nel 2018 come standard proposto in RFC 8446

Configurare un Chroot su Debian

Questo articolo ti insegnerà come impostare una prigione chroot su Debian. Presumo che tu stia usando Debian 7.x. Se usi Debian 6 o 8, questo potrebbe funzionare, bu

Come installare PiVPN su Debian

Introduzione Un modo semplice per configurare un server VPN su Debian è con PiVPN. PiVPN è un programma di installazione e wrapper per OpenVPN. Crea semplici comandi per te t

Lintelligenza artificiale può combattere con un numero crescente di attacchi ransomware?

Gli attacchi ransomware sono in aumento, ma l'intelligenza artificiale può aiutare ad affrontare l'ultimo virus informatico? L'intelligenza artificiale è la risposta? Leggi qui sai è AI boone o bane

ReactOS: è questo il futuro di Windows?

ReactOS, un sistema operativo open source e gratuito è qui con l'ultima versione. Può essere sufficiente alle esigenze degli utenti Windows moderni e abbattere Microsoft? Scopriamo di più su questo vecchio stile, ma un'esperienza del sistema operativo più recente.

Rimani connesso tramite lapp desktop WhatsApp 24*7

Whatsapp ha finalmente lanciato l'app desktop per utenti Mac e Windows. Ora puoi accedere facilmente a Whatsapp da Windows o Mac. Disponibile per Windows 8+ e Mac OS 10.9+

In che modo lintelligenza artificiale può portare lautomazione dei processi al livello successivo?

Leggi questo per sapere come l'intelligenza artificiale sta diventando popolare tra le aziende di piccole dimensioni e come sta aumentando le probabilità di farle crescere e dare un vantaggio ai loro concorrenti.

Laggiornamento del supplemento macOS Catalina 10.15.4 sta causando più problemi che risolverli

Recentemente Apple ha rilasciato macOS Catalina 10.15.4 un aggiornamento supplementare per risolvere i problemi, ma sembra che l'aggiornamento stia causando più problemi che portano al bricking delle macchine mac. Leggi questo articolo per saperne di più

13 strumenti commerciali per lestrazione dei dati dai Big Data

13 strumenti commerciali per l'estrazione dei dati dai Big Data

Che cosè un file system di journaling e come funziona?

Il nostro computer memorizza tutti i dati in un modo organizzato noto come file system di journaling. È un metodo efficiente che consente al computer di cercare e visualizzare i file non appena si preme search.https://wethegeek.com/?p=94116&preview=true

Singolarità tecnologica: un lontano futuro della civiltà umana?

Man mano che la scienza si evolve a un ritmo rapido, assumendo gran parte dei nostri sforzi, aumentano anche i rischi di sottoporci a una singolarità inspiegabile. Leggi, cosa potrebbe significare per noi la singolarità.

Uno sguardo a 26 tecniche di analisi dei Big Data: Parte 1

Limpatto dellintelligenza artificiale nella sanità 2021

L'intelligenza artificiale nell'assistenza sanitaria ha compiuto grandi passi avanti negli ultimi decenni. Pertanto, il futuro dell'IA in sanità continua a crescere giorno dopo giorno.