Funkcjonalności warstw architektury referencyjnej Big Data
Przeczytaj blog, aby w najprostszy sposób poznać różne warstwy w architekturze Big Data i ich funkcjonalności.
Tradycyjne podejścia do programowania są trudne do utrzymania przy stosowaniu złożonych modeli uczenia maszynowego w produkcji. Rozwój na laptopie lub maszynie lokalnej może być powolny w szkoleniu modelu uczenia maszynowego dla inżynierów głębokiego uczenia się. W rezultacie zwykle używamy maszyn w chmurze z bardziej wydajnym sprzętem do szkolenia i uruchamiania naszych modeli uczenia maszynowego. Jest to dobra praktyka, ponieważ analizujemy złożone obliczenia i zamiast tego wykonujemy żądania AJAX w razie potrzeby. W tym samouczku udostępnimy wstępnie wyszkolony model dogłębnej nauki o nazwie Word2Vec innym usługom, budując interfejs API REST od podstaw.
sudo
użytkownikOsadzanie słów to najnowszy rozwój przetwarzania języka naturalnego i głębokiego uczenia się, który zrewolucjonizował obie dziedziny z powodu szybkiego postępu. Osadzanie słów to wektory, z których każdy odpowiada pojedynczemu słowu, tak że wektory oznaczają słowa. Można to wykazać za pomocą pewnych zjawisk, takich jak wektor king - queen = boy - girl
. Wektory słowne służą do budowania wszystkiego, od silników rekomendacji po boty czatowe, które faktycznie rozumieją język angielski.
Osadzanie słów nie jest przypadkowe; są one generowane przez szkolenie sieci neuronowej. Ostatnia potężna implementacja osadzania słów pochodzi od Google o nazwie Word2Vec, która jest szkolona przez przewidywanie słów pojawiających się obok innych słów w języku. Na przykład dla słowa "cat"
sieć neuronowa przewiduje słowa "kitten"
i "feline"
. Ta intuicja słów pojawiających się blisko siebie pozwala nam umieścić je w przestrzeni wektorowej.
W praktyce jednak używamy wstępnie przeszkolonych modeli innych dużych korporacji, takich jak Google, w celu szybkiego prototypowania i uproszczenia procesów wdrażania. W tym samouczku pobieramy i używamy wstępnie wyszkolonego osadzania słów Google Word2Vec. Możemy to zrobić, uruchamiając następującą komendę w naszym katalogu roboczym.
wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude
Pobrany przez nas model osadzania wyrazów ma .magnitude
format. Ten format pozwala nam efektywnie odpytywać model za pomocą SQL, a zatem jest optymalnym formatem osadzania dla serwerów produkcyjnych. Ponieważ musimy być w stanie odczytać .magnitude
format, zainstalujemy pymagnitude
pakiet. Zainstalujemy również, flask
aby później obsługiwać prognozy głębokiego uczenia się wykonane przez model.
pip3 install pymagnitude flask
Dodamy go również do naszego narzędzia do śledzenia zależności za pomocą następującego polecenia. Spowoduje to utworzenie pliku o nazwie requirements.txt
i zapisanie naszych bibliotek Python, abyśmy mogli je ponownie zainstalować w późniejszym czasie.
pip3 freeze > requirements.txt
Na początek utworzymy plik do obsługi otwierania i wysyłania zapytań o osadzanie słów.
touch model.py
Następnie dodamy następujące wiersze, model.py
aby zaimportować wielkość.
from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')
Możemy bawić się pymagnitude
pakietem i modelem dogłębnego uczenia się, korzystając z query
metody dostarczającej argumentu dla słowa.
cat_vector = vectors.query('cat')
print(cat_vector)
W rdzeniu naszego API zdefiniujemy funkcję zwracającą różnicę znaczenia między dwoma słowami. Jest to podstawa większości rozwiązań do głębokiego uczenia się, takich jak mechanizmy rekomendacji (tj. Wyświetlanie treści z podobnymi słowami).
Możemy korzystać z tej funkcji, korzystając z funkcji similarity
i most_similar
.
print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))
Wdrażamy kalkulator podobieństwa w następujący sposób. Ta metoda zostanie wywołana przez Flask API w następnej sekcji. Zauważ, że ta funkcja zwraca rzeczywistą wartość od 0 do 1.
def similarity(word1, word2):
return vectors.similarity(word1, word2)
Stworzymy nasz serwer w pliku o service.py
następującej treści. Importujemy flask
i request
obsługujemy nasze możliwości serwera oraz importujemy similarity
silnik z modułu, który napisaliśmy wcześniej.
from flask import Flask, request
from model import similarity
app = Flask(__name__)
@app.route("/", methods=['GET'])
def welcome():
return "Welcome to our Machine Learning REST API!"
@app.route("/similarity", methods=['GET'])
def similarity_route():
word1 = request.args.get("word1")
word2 = request.args.get("word2")
return str(similarity(word1, word2))
if __name__ == "__main__":
app.run(port=8000, debug=True)
Nasz serwer to raczej gołe kości, ale można go łatwo rozszerzyć, tworząc więcej tras za pomocą @app.route
dekoratora.
Możemy uruchomić nasz serwer Flask, uruchamiając następujące polecenia, aby aktywować nasze środowisko wirtualne, zainstalować nasze pakiety i uruchomić powiązany z nim plik Python.
source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py
Nasz serwer będzie dostępny pod adresem localhost:8000
. Możemy przeszukiwać naszą bazę danych localhost:8000/similarity?word1=cat&word2=dog
i przeglądać odpowiedź w przeglądarce lub za pośrednictwem innego klienta AJAX.
Przeczytaj blog, aby w najprostszy sposób poznać różne warstwy w architekturze Big Data i ich funkcjonalności.
Chcesz zobaczyć rewolucyjne wynalazki Google i jak te wynalazki zmieniły życie każdego człowieka dzisiaj? Następnie czytaj na blogu, aby zobaczyć wynalazki Google.
13 komercyjnych narzędzi do ekstrakcji danych z Big Data
Whatsapp w końcu uruchomił aplikację Desktop dla użytkowników komputerów Mac i Windows. Teraz możesz łatwo uzyskać dostęp do Whatsapp z systemu Windows lub Mac. Dostępne dla Windows 8+ i Mac OS 10.9+
Energia jądrowa jest zawsze pogardzana, nigdy jej nie szanujemy z powodu przeszłych wydarzeń, ale nie zawsze jest zła. Przeczytaj post, aby dowiedzieć się więcej na ten temat.
Koncepcja autonomicznych samochodów, które wyjadą na drogi za pomocą sztucznej inteligencji, to marzenie, które mamy już od jakiegoś czasu. Ale pomimo kilku obietnic nigdzie ich nie widać. Przeczytaj ten blog, aby dowiedzieć się więcej…
Wzrasta liczba ataków ransomware, ale czy sztuczna inteligencja może pomóc w radzeniu sobie z najnowszym wirusem komputerowym? Czy AI jest odpowiedzią? Przeczytaj tutaj, wiedz, że sztuczna inteligencja jest zmorą lub zgubą
Sztuczna inteligencja nie jest dla ludzi nową nazwą. Ponieważ sztuczna inteligencja jest włączona do każdego strumienia, jednym z nich jest opracowywanie narzędzi zwiększających ludzką wydajność i dokładność. Skorzystaj z tych niesamowitych narzędzi uczenia maszynowego i uprość swoje codzienne zadania.
Zawsze potrzebujemy Big Data Analytics do efektywnego zarządzania danymi. W tym artykule omówiliśmy kilka technik analizy Big Data. Sprawdź ten artykuł.
Czy jesteś również ofiarą ataków DDOS i nie masz pewności co do metod zapobiegania? Przeczytaj ten artykuł, aby rozwiązać swoje pytania.