Jak utworzyć interfejs API REST do głębokiego uczenia się za pomocą Word2Vec i Flask

Wymagania wstępne
Jakie są osadzenia słów?
Instalowanie kolby i pakietów wielkości
Zapytanie o model Word2Vec
Tworzenie interfejsu API REST
Wykonywanie wywołań interfejsu API

Tradycyjne podejścia do programowania są trudne do utrzymania przy stosowaniu złożonych modeli uczenia maszynowego w produkcji. Rozwój na laptopie lub maszynie lokalnej może być powolny w szkoleniu modelu uczenia maszynowego dla inżynierów głębokiego uczenia się. W rezultacie zwykle używamy maszyn w chmurze z bardziej wydajnym sprzętem do szkolenia i uruchamiania naszych modeli uczenia maszynowego. Jest to dobra praktyka, ponieważ analizujemy złożone obliczenia i zamiast tego wykonujemy żądania AJAX w razie potrzeby. W tym samouczku udostępnimy wstępnie wyszkolony model dogłębnej nauki o nazwie Word2Vec innym usługom, budując interfejs API REST od podstaw.

Wymagania wstępne

Instancja serwera Ubuntu 16.04 z co najmniej 4 GB pamięci RAM. Do celów testowania i programowania możesz wybrać instancję z 4 GB pamięci RAM
Zrozumienie, jak używać systemu operacyjnego Linux do tworzenia / nawigacji / edycji folderów i plików
sudoużytkownik

Jakie są osadzenia słów?

Osadzanie słów to najnowszy rozwój przetwarzania języka naturalnego i głębokiego uczenia się, który zrewolucjonizował obie dziedziny z powodu szybkiego postępu. Osadzanie słów to wektory, z których każdy odpowiada pojedynczemu słowu, tak że wektory oznaczają słowa. Można to wykazać za pomocą pewnych zjawisk, takich jak wektor king - queen = boy - girl. Wektory słowne służą do budowania wszystkiego, od silników rekomendacji po boty czatowe, które faktycznie rozumieją język angielski.

Osadzanie słów nie jest przypadkowe; są one generowane przez szkolenie sieci neuronowej. Ostatnia potężna implementacja osadzania słów pochodzi od Google o nazwie Word2Vec, która jest szkolona przez przewidywanie słów pojawiających się obok innych słów w języku. Na przykład dla słowa "cat"sieć neuronowa przewiduje słowa "kitten"i "feline". Ta intuicja słów pojawiających się blisko siebie pozwala nam umieścić je w przestrzeni wektorowej.

W praktyce jednak używamy wstępnie przeszkolonych modeli innych dużych korporacji, takich jak Google, w celu szybkiego prototypowania i uproszczenia procesów wdrażania. W tym samouczku pobieramy i używamy wstępnie wyszkolonego osadzania słów Google Word2Vec. Możemy to zrobić, uruchamiając następującą komendę w naszym katalogu roboczym.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Instalowanie kolby i pakietów wielkości

Pobrany przez nas model osadzania wyrazów ma .magnitudeformat. Ten format pozwala nam efektywnie odpytywać model za pomocą SQL, a zatem jest optymalnym formatem osadzania dla serwerów produkcyjnych. Ponieważ musimy być w stanie odczytać .magnitudeformat, zainstalujemy pymagnitudepakiet. Zainstalujemy również, flaskaby później obsługiwać prognozy głębokiego uczenia się wykonane przez model.

pip3 install pymagnitude flask

Dodamy go również do naszego narzędzia do śledzenia zależności za pomocą następującego polecenia. Spowoduje to utworzenie pliku o nazwie requirements.txti zapisanie naszych bibliotek Python, abyśmy mogli je ponownie zainstalować w późniejszym czasie.

pip3 freeze > requirements.txt

Zapytanie o model Word2Vec

Na początek utworzymy plik do obsługi otwierania i wysyłania zapytań o osadzanie słów.

touch model.py

Następnie dodamy następujące wiersze, model.pyaby zaimportować wielkość.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Możemy bawić się pymagnitudepakietem i modelem dogłębnego uczenia się, korzystając z querymetody dostarczającej argumentu dla słowa.

cat_vector = vectors.query('cat')
print(cat_vector)

W rdzeniu naszego API zdefiniujemy funkcję zwracającą różnicę znaczenia między dwoma słowami. Jest to podstawa większości rozwiązań do głębokiego uczenia się, takich jak mechanizmy rekomendacji (tj. Wyświetlanie treści z podobnymi słowami).

Możemy korzystać z tej funkcji, korzystając z funkcji similarityi most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Wdrażamy kalkulator podobieństwa w następujący sposób. Ta metoda zostanie wywołana przez Flask API w następnej sekcji. Zauważ, że ta funkcja zwraca rzeczywistą wartość od 0 do 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Tworzenie interfejsu API REST

Stworzymy nasz serwer w pliku o service.pynastępującej treści. Importujemy flaski requestobsługujemy nasze możliwości serwera oraz importujemy similaritysilnik z modułu, który napisaliśmy wcześniej.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Nasz serwer to raczej gołe kości, ale można go łatwo rozszerzyć, tworząc więcej tras za pomocą @app.routedekoratora.

Wykonywanie wywołań interfejsu API

Możemy uruchomić nasz serwer Flask, uruchamiając następujące polecenia, aby aktywować nasze środowisko wirtualne, zainstalować nasze pakiety i uruchomić powiązany z nim plik Python.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Nasz serwer będzie dostępny pod adresem localhost:8000. Możemy przeszukiwać naszą bazę danych localhost:8000/similarity?word1=cat&word2=dogi przeglądać odpowiedź w przeglądarce lub za pośrednictwem innego klienta AJAX.

Zostaw komentarz

Komentarz *

Imię *

Strona internetowa

Funkcjonalności warstw architektury referencyjnej Big Data

Przeczytaj blog, aby w najprostszy sposób poznać różne warstwy w architekturze Big Data i ich funkcjonalności.

Rewolucyjne wynalazki Google, które ułatwią Twoje życie.

Chcesz zobaczyć rewolucyjne wynalazki Google i jak te wynalazki zmieniły życie każdego człowieka dzisiaj? Następnie czytaj na blogu, aby zobaczyć wynalazki Google.

13 komercyjnych narzędzi do ekstrakcji danych z Big Data

Pozostań w kontakcie dzięki aplikacji WhatsApp na komputer 24*7

Whatsapp w końcu uruchomił aplikację Desktop dla użytkowników komputerów Mac i Windows. Teraz możesz łatwo uzyskać dostęp do Whatsapp z systemu Windows lub Mac. Dostępne dla Windows 8+ i Mac OS 10.9+

5 przykładów, które dowodzą, że energetyka jądrowa nie zawsze jest zła

Energia jądrowa jest zawsze pogardzana, nigdy jej nie szanujemy z powodu przeszłych wydarzeń, ale nie zawsze jest zła. Przeczytaj post, aby dowiedzieć się więcej na ten temat.

Friday Essential: Co się stało z samochodami sterowanymi przez sztuczną inteligencję?

Koncepcja autonomicznych samochodów, które wyjadą na drogi za pomocą sztucznej inteligencji, to marzenie, które mamy już od jakiegoś czasu. Ale pomimo kilku obietnic nigdzie ich nie widać. Przeczytaj ten blog, aby dowiedzieć się więcej…

5 przydatnych narzędzi sztucznej inteligencji, które uproszczą Twoje życie

Sztuczna inteligencja nie jest dla ludzi nową nazwą. Ponieważ sztuczna inteligencja jest włączona do każdego strumienia, jednym z nich jest opracowywanie narzędzi zwiększających ludzką wydajność i dokładność. Skorzystaj z tych niesamowitych narzędzi uczenia maszynowego i uprość swoje codzienne zadania.

Czy AI może walczyć z rosnącą liczbą ataków ransomware?

Wzrasta liczba ataków ransomware, ale czy sztuczna inteligencja może pomóc w radzeniu sobie z najnowszym wirusem komputerowym? Czy AI jest odpowiedzią? Przeczytaj tutaj, wiedz, że sztuczna inteligencja jest zmorą lub zgubą

Wgląd w 26 technik analizy Big Data: część 2

Zawsze potrzebujemy Big Data Analytics do efektywnego zarządzania danymi. W tym artykule omówiliśmy kilka technik analizy Big Data. Sprawdź ten artykuł.

Ataki DDOS: krótki przegląd

Czy jesteś również ofiarą ataków DDOS i nie masz pewności co do metod zapobiegania? Przeczytaj ten artykuł, aby rozwiązać swoje pytania.