Jak utworzyć interfejs API REST do głębokiego uczenia się za pomocą Word2Vec i Flask

Tradycyjne podejścia do programowania są trudne do utrzymania przy stosowaniu złożonych modeli uczenia maszynowego w produkcji. Rozwój na laptopie lub maszynie lokalnej może być powolny w szkoleniu modelu uczenia maszynowego dla inżynierów głębokiego uczenia się. W rezultacie zwykle używamy maszyn w chmurze z bardziej wydajnym sprzętem do szkolenia i uruchamiania naszych modeli uczenia maszynowego. Jest to dobra praktyka, ponieważ analizujemy złożone obliczenia i zamiast tego wykonujemy żądania AJAX w razie potrzeby. W tym samouczku udostępnimy wstępnie wyszkolony model dogłębnej nauki o nazwie Word2Vec innym usługom, budując interfejs API REST od podstaw.

Wymagania wstępne

  • Instancja serwera Ubuntu 16.04 z co najmniej 4 GB pamięci RAM. Do celów testowania i programowania możesz wybrać instancję z 4 GB pamięci RAM
  • Zrozumienie, jak używać systemu operacyjnego Linux do tworzenia / nawigacji / edycji folderów i plików
  • sudoużytkownik

Jakie są osadzenia słów?

Osadzanie słów to najnowszy rozwój przetwarzania języka naturalnego i głębokiego uczenia się, który zrewolucjonizował obie dziedziny z powodu szybkiego postępu. Osadzanie słów to wektory, z których każdy odpowiada pojedynczemu słowu, tak że wektory oznaczają słowa. Można to wykazać za pomocą pewnych zjawisk, takich jak wektor king - queen = boy - girl. Wektory słowne służą do budowania wszystkiego, od silników rekomendacji po boty czatowe, które faktycznie rozumieją język angielski.

Osadzanie słów nie jest przypadkowe; są one generowane przez szkolenie sieci neuronowej. Ostatnia potężna implementacja osadzania słów pochodzi od Google o nazwie Word2Vec, która jest szkolona przez przewidywanie słów pojawiających się obok innych słów w języku. Na przykład dla słowa "cat"sieć neuronowa przewiduje słowa "kitten"i "feline". Ta intuicja słów pojawiających się blisko siebie pozwala nam umieścić je w przestrzeni wektorowej.

W praktyce jednak używamy wstępnie przeszkolonych modeli innych dużych korporacji, takich jak Google, w celu szybkiego prototypowania i uproszczenia procesów wdrażania. W tym samouczku pobieramy i używamy wstępnie wyszkolonego osadzania słów Google Word2Vec. Możemy to zrobić, uruchamiając następującą komendę w naszym katalogu roboczym.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Instalowanie kolby i pakietów wielkości

Pobrany przez nas model osadzania wyrazów ma .magnitudeformat. Ten format pozwala nam efektywnie odpytywać model za pomocą SQL, a zatem jest optymalnym formatem osadzania dla serwerów produkcyjnych. Ponieważ musimy być w stanie odczytać .magnitudeformat, zainstalujemy pymagnitudepakiet. Zainstalujemy również, flaskaby później obsługiwać prognozy głębokiego uczenia się wykonane przez model.

pip3 install pymagnitude flask

Dodamy go również do naszego narzędzia do śledzenia zależności za pomocą następującego polecenia. Spowoduje to utworzenie pliku o nazwie requirements.txti zapisanie naszych bibliotek Python, abyśmy mogli je ponownie zainstalować w późniejszym czasie.

pip3 freeze > requirements.txt

Zapytanie o model Word2Vec

Na początek utworzymy plik do obsługi otwierania i wysyłania zapytań o osadzanie słów.

touch model.py

Następnie dodamy następujące wiersze, model.pyaby zaimportować wielkość.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Możemy bawić się pymagnitudepakietem i modelem dogłębnego uczenia się, korzystając z querymetody dostarczającej argumentu dla słowa.

cat_vector = vectors.query('cat')
print(cat_vector)

W rdzeniu naszego API zdefiniujemy funkcję zwracającą różnicę znaczenia między dwoma słowami. Jest to podstawa większości rozwiązań do głębokiego uczenia się, takich jak mechanizmy rekomendacji (tj. Wyświetlanie treści z podobnymi słowami).

Możemy korzystać z tej funkcji, korzystając z funkcji similarityi most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Wdrażamy kalkulator podobieństwa w następujący sposób. Ta metoda zostanie wywołana przez Flask API w następnej sekcji. Zauważ, że ta funkcja zwraca rzeczywistą wartość od 0 do 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Tworzenie interfejsu API REST

Stworzymy nasz serwer w pliku o service.pynastępującej treści. Importujemy flaski requestobsługujemy nasze możliwości serwera oraz importujemy similaritysilnik z modułu, który napisaliśmy wcześniej.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Nasz serwer to raczej gołe kości, ale można go łatwo rozszerzyć, tworząc więcej tras za pomocą @app.routedekoratora.

Wykonywanie wywołań interfejsu API

Możemy uruchomić nasz serwer Flask, uruchamiając następujące polecenia, aby aktywować nasze środowisko wirtualne, zainstalować nasze pakiety i uruchomić powiązany z nim plik Python.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Nasz serwer będzie dostępny pod adresem localhost:8000. Możemy przeszukiwać naszą bazę danych localhost:8000/similarity?word1=cat&word2=dogi przeglądać odpowiedź w przeglądarce lub za pośrednictwem innego klienta AJAX.



Leave a Comment

Jak zainstalować platformę koszyków LiteCart na Ubuntu 16.04

Jak zainstalować platformę koszyków LiteCart na Ubuntu 16.04

LiteCart to darmowa i otwarta platforma koszyka na zakupy napisana w PHP, jQuery i HTML 5. Jest to prosty, lekki i łatwy w użyciu program do handlu elektronicznego

Jak zainstalować Anchor CMS na CentOS 7 LAMP VPS

Jak zainstalować Anchor CMS na CentOS 7 LAMP VPS

Używasz innego systemu? Anchor CMS to bardzo prosty i niezwykle lekki, darmowy i otwarty system zarządzania treścią (CMS) Blog Engine, który

Skonfiguruj udział NFS na Debianie

Skonfiguruj udział NFS na Debianie

NFS to oparty na sieci system plików, który umożliwia komputerom dostęp do plików w sieci komputerowej. Ten przewodnik wyjaśnia, w jaki sposób możesz udostępniać foldery w NF

Jak zainstalować Matomo Analytics na Fedorze 28

Jak zainstalować Matomo Analytics na Fedorze 28

Używasz innego systemu? Matomo (wcześniej Piwik) to platforma analityczna typu open source, otwarta alternatywa dla Google Analytics. Źródło Matomo jest hostowane o

Skonfiguruj serwer TeamTalk w systemie Linux

Skonfiguruj serwer TeamTalk w systemie Linux

TeamTalk to system konferencyjny, który pozwala użytkownikom na wysokiej jakości rozmowy audio / wideo, czat tekstowy, przesyłanie plików i udostępnianie ekranów. To ja

Jak uzyskać dostęp do Vultr VPS

Jak uzyskać dostęp do Vultr VPS

Vultr oferuje kilka różnych sposobów uzyskiwania dostępu do VPS w celu konfiguracji, instalacji i użytkowania. Poświadczenia dostępu Domyślne poświadczenia dostępu dla twojego VPS ar

Jak zainstalować Ranger Terminal File Manager w systemie Linux

Jak zainstalować Ranger Terminal File Manager w systemie Linux

Ranger to oparty na linii poleceń menedżer plików z powiązaniami klawiszy VI. Zapewnia minimalistyczny i ładny interfejs curses z widokiem na hierarchię katalogów

Skonfiguruj klaster RethinkDB w CentOS 7

Skonfiguruj klaster RethinkDB w CentOS 7

Wprowadzenie RethinkDB to baza danych NoSQL, która przechowuje dane jako dokumenty JSON. Ma bardzo intuicyjny język zapytań i funkcje powszechnie dostępne

Skonfiguruj Magento na CentOS 6

Skonfiguruj Magento na CentOS 6

Niezależnie od tego, czy chcesz umieścić zapasy sklepów online, czy po prostu prosty sklep z akcesoriami technicznymi, Magento jest doskonałym rozwiązaniem dla eCommerce online. Ten artykuł

Jak zbudować Brotli ze źródła na Ubuntu 18.04 LTS

Jak zbudować Brotli ze źródła na Ubuntu 18.04 LTS

Używasz innego systemu? Brotli to nowa metoda kompresji z lepszym współczynnikiem kompresji niż GZIP. Jego kod źródłowy jest publicznie hostowany na tym Githu

Korzystanie z widoków MySQL w Debianie 7

Korzystanie z widoków MySQL w Debianie 7

Wprowadzenie MySQL ma świetną funkcję znaną jako widoki. Widoki są przechowywane zapytania. Pomyśl o nich jako o aliasie dla długiego zapytania. W tym przewodniku

Wyłącz lub ogranicz logowanie roota przez SSH w systemie Linux

Wyłącz lub ogranicz logowanie roota przez SSH w systemie Linux

Zezwolenie na logowanie roota przez SSH jest powszechnie uważane za słabą praktykę bezpieczeństwa w branży technologicznej. Zamiast tego możesz wykonać delikatną administrację

Jak zainstalować Neos CMS na CentOS 7

Jak zainstalować Neos CMS na CentOS 7

Neos to innowacyjny system zarządzania treścią typu open source, który doskonale nadaje się do tworzenia i edytowania treści online. Z myślą o autorach i redaktorach, Neo

Jak zainstalować Vtiger CRM Open Source Edition na CentOS 7

Jak zainstalować Vtiger CRM Open Source Edition na CentOS 7

Vtiger CRM to popularna aplikacja do zarządzania relacjami z klientami, która może pomóc przedsiębiorstwom zwiększyć sprzedaż, zapewnić obsługę klienta i zwiększyć zyski. ja

Jak zainstalować DokuWiki na Ubuntu 16.04 LTS

Jak zainstalować DokuWiki na Ubuntu 16.04 LTS

Używasz innego systemu? DokuWiki to program wiki typu open source napisany w PHP, który nie wymaga bazy danych. Przechowuje dane w plikach tekstowych. DokuWik

Konfigurowanie chroota w Debianie

Konfigurowanie chroota w Debianie

W tym artykule dowiesz się, jak skonfigurować więzienie chroot w Debianie. Zakładam, że używasz Debiana 7.x. Jeśli używasz Debiana 6 lub 8, może to działać, bu

Jak zainstalować PiVPN na Debianie

Jak zainstalować PiVPN na Debianie

Wprowadzenie Prostym sposobem na skonfigurowanie serwera VPN na Debianie jest PiVPN. PiVPN to instalator i opakowanie dla OpenVPN. Tworzy proste polecenia dla ciebie

Jak zainstalować MaraDNS na CentOS 6

Jak zainstalować MaraDNS na CentOS 6

MaraDNS to lekki, ale solidny program serwera DNS typu open source. W porównaniu z innymi aplikacjami tego samego rodzaju, takimi jak ISC BIND, PowerDNS i djbdns

Jak zainstalować i skonfigurować CyberPanel na Ubuntu 18.04 LTS

Jak zainstalować i skonfigurować CyberPanel na Ubuntu 18.04 LTS

Używasz innego systemu? Wprowadzenie CyberPanel jest jednym z pierwszych paneli sterowania na rynku, który jest zarówno open source, jak i wykorzystuje OpenLiteSpeed. Co ty?

Jak zainstalować forum NodeBB na Fedorze 28

Jak zainstalować forum NodeBB na Fedorze 28

Używasz innego systemu? NodeBB jest forum opartym na Node.js. Wykorzystuje gniazda sieciowe do natychmiastowych interakcji i powiadomień w czasie rzeczywistym. Kod źródłowy NodeBB i

Funkcjonalności warstw architektury referencyjnej Big Data

Funkcjonalności warstw architektury referencyjnej Big Data

Przeczytaj blog, aby w najprostszy sposób poznać różne warstwy w architekturze Big Data i ich funkcjonalności.

Rewolucyjne wynalazki Google, które ułatwią Twoje życie.

Rewolucyjne wynalazki Google, które ułatwią Twoje życie.

Chcesz zobaczyć rewolucyjne wynalazki Google i jak te wynalazki zmieniły życie każdego człowieka dzisiaj? Następnie czytaj na blogu, aby zobaczyć wynalazki Google.

13 komercyjnych narzędzi do ekstrakcji danych z Big Data

13 komercyjnych narzędzi do ekstrakcji danych z Big Data

13 komercyjnych narzędzi do ekstrakcji danych z Big Data

Pozostań w kontakcie dzięki aplikacji WhatsApp na komputer 24*7

Pozostań w kontakcie dzięki aplikacji WhatsApp na komputer 24*7

Whatsapp w końcu uruchomił aplikację Desktop dla użytkowników komputerów Mac i Windows. Teraz możesz łatwo uzyskać dostęp do Whatsapp z systemu Windows lub Mac. Dostępne dla Windows 8+ i Mac OS 10.9+

5 przykładów, które dowodzą, że energetyka jądrowa nie zawsze jest zła

5 przykładów, które dowodzą, że energetyka jądrowa nie zawsze jest zła

Energia jądrowa jest zawsze pogardzana, nigdy jej nie szanujemy z powodu przeszłych wydarzeń, ale nie zawsze jest zła. Przeczytaj post, aby dowiedzieć się więcej na ten temat.

Friday Essential: Co się stało z samochodami sterowanymi przez sztuczną inteligencję?

Friday Essential: Co się stało z samochodami sterowanymi przez sztuczną inteligencję?

Koncepcja autonomicznych samochodów, które wyjadą na drogi za pomocą sztucznej inteligencji, to marzenie, które mamy już od jakiegoś czasu. Ale pomimo kilku obietnic nigdzie ich nie widać. Przeczytaj ten blog, aby dowiedzieć się więcej…

Czy AI może walczyć z rosnącą liczbą ataków ransomware?

Czy AI może walczyć z rosnącą liczbą ataków ransomware?

Wzrasta liczba ataków ransomware, ale czy sztuczna inteligencja może pomóc w radzeniu sobie z najnowszym wirusem komputerowym? Czy AI jest odpowiedzią? Przeczytaj tutaj, wiedz, że sztuczna inteligencja jest zmorą lub zgubą

5 przydatnych narzędzi sztucznej inteligencji, które uproszczą Twoje życie

5 przydatnych narzędzi sztucznej inteligencji, które uproszczą Twoje życie

Sztuczna inteligencja nie jest dla ludzi nową nazwą. Ponieważ sztuczna inteligencja jest włączona do każdego strumienia, jednym z nich jest opracowywanie narzędzi zwiększających ludzką wydajność i dokładność. Skorzystaj z tych niesamowitych narzędzi uczenia maszynowego i uprość swoje codzienne zadania.

Wgląd w 26 technik analizy Big Data: część 2

Wgląd w 26 technik analizy Big Data: część 2

Zawsze potrzebujemy Big Data Analytics do efektywnego zarządzania danymi. W tym artykule omówiliśmy kilka technik analizy Big Data. Sprawdź ten artykuł.

Ataki DDOS: krótki przegląd

Ataki DDOS: krótki przegląd

Czy jesteś również ofiarą ataków DDOS i nie masz pewności co do metod zapobiegania? Przeczytaj ten artykuł, aby rozwiązać swoje pytania.