Word2Vec और फ्लास्क के साथ एक डीप लर्निंग रेस्ट एपीआई कैसे बनाएं

उत्पादन में जटिल मशीन लर्निंग मॉडल का उपयोग करते समय विकास के लिए पारंपरिक दृष्टिकोण को बनाए रखना मुश्किल है। गहन शिक्षण इंजीनियरों के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए एक लैपटॉप या स्थानीय मशीन पर विकास धीमा हो सकता है। परिणामस्वरूप, हम आमतौर पर क्लाउड मशीन का उपयोग अधिक शक्तिशाली हार्डवेयर के साथ दोनों ट्रेन और हमारे मशीन लर्निंग मॉडल को चलाने के लिए करते हैं। यह अच्छा अभ्यास है क्योंकि हम जटिल गणना को सार करते हैं और इसके बजाय AJAX के अनुरोधों को आवश्यक बनाते हैं। इस ट्यूटोरियल में, हम एक पूर्व-प्रशिक्षित डीप लर्निंग मॉडल बनाएंगे, जिसका नाम Word2Vec है, जो अन्य सेवाओं के लिए उपलब्ध है।

आवश्यक शर्तें

  • कम से कम 4 जीबी रैम के साथ एक Ubuntu 16.04 सर्वर का उदाहरण। परीक्षण और विकास के उद्देश्यों के लिए, आप 4GB रैम के साथ एक उदाहरण चुन सकते हैं
  • फ़ोल्डर्स और फ़ाइलों को बनाने / नेविगेट / संपादित करने के लिए लिनक्स ऑपरेटिंग सिस्टम का उपयोग करने के तरीके की समझ
  • एक sudoउपयोगकर्ता

वर्ड एंबेडिंग क्या हैं?

शब्द एम्बेडिंग प्राकृतिक भाषा प्रसंस्करण और गहरी सीखने में हाल ही में एक विकास है जिसने तेजी से प्रगति के कारण दोनों क्षेत्रों में क्रांति ला दी है। शब्द एम्बेडिंग अनिवार्य रूप से वैक्टर हैं जो प्रत्येक एक शब्द के अनुरूप हैं जैसे कि वैक्टर शब्द का अर्थ है। यह कुछ घटनाओं जैसे वेक्टर के लिए प्रदर्शित किया जा सकता है king - queen = boy - girl। शब्द वैक्टर का उपयोग सिफारिश इंजन से चैट-बॉट्स तक सब कुछ बनाने के लिए किया जाता है जो वास्तव में अंग्रेजी भाषा को समझते हैं।

शब्द एम्बेडिंग यादृच्छिक नहीं है; वे एक तंत्रिका नेटवर्क के प्रशिक्षण द्वारा उत्पन्न होते हैं। हाल ही में एक शक्तिशाली शब्द एम्बेडिंग कार्यान्वयन Google से आया है जिसका नाम Word2Vec है जो उन शब्दों की भविष्यवाणी करके प्रशिक्षित किया जाता है जो किसी भाषा में दूसरे शब्दों के बगल में दिखाई देते हैं। उदाहरण के लिए, शब्द के लिए "cat", तंत्रिका नेटवर्क शब्दों की भविष्यवाणी करेगा "kitten"और "feline"। एक दूसरे के निकट आने वाले शब्दों का यह अंतर्ज्ञान हमें उन्हें वेक्टर अंतरिक्ष में रखने की अनुमति देता है।

हालाँकि, व्यवहार में, हम Google जैसे अन्य बड़े निगमों के पूर्व-प्रशिक्षित मॉडल का उपयोग करते हैं ताकि वे जल्दी से प्रोटोटाइप के लिए और तैनाती प्रक्रियाओं को सरल बना सकें। इस ट्यूटोरियल में हम Google के Word2Vec के पूर्व-प्रशिक्षित शब्द एम्बेडिंग को डाउनलोड और उपयोग करेंगे। हम अपनी कार्य निर्देशिका में निम्न कमांड चलाकर ऐसा कर सकते हैं।

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

फ्लास्क और मैग्नेटिट पैकेज स्थापित करना

हमारे द्वारा डाउनलोड किया गया एम्बेडिंग मॉडल एक .magnitudeप्रारूप में है। यह प्रारूप हमें SQL का उपयोग करके कुशलता से मॉडल को क्वेरी करने की अनुमति देता है, और इसलिए उत्पादन सर्वर के लिए इष्टतम एम्बेडिंग प्रारूप है। चूंकि हमें .magnitudeप्रारूप को पढ़ने में सक्षम होना चाहिए , हम pymagnitudeपैकेज को स्थापित करेंगे । हम flaskबाद में मॉडल द्वारा की गई गहरी सीखने की भविष्यवाणियों की सेवा करने के लिए भी स्थापित होंगे ।

pip3 install pymagnitude flask

हम इसे निम्नलिखित कमांड के साथ हमारे निर्भरता ट्रैकर में भी जोड़ देंगे। यह requirements.txtहमारे पायथन लाइब्रेरीज़ नामक एक फ़ाइल बनाता है और बाद में हम उन्हें बाद में पुनः स्थापित कर सकते हैं।

pip3 freeze > requirements.txt

Word2Vec मॉडल को छोड़कर

शुरू करने के लिए, हम एम्बेडिंग शब्द को खोलने और क्वेरी करने के लिए एक फाइल बनाएंगे।

touch model.py

अगला, हम model.pyपरिमाण को आयात करने के लिए निम्नलिखित पंक्तियों को जोड़ेंगे ।

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

हम एक शब्द के लिए एक तर्क प्रदान pymagnitudeकरते हुए, queryपद्धति का उपयोग करके पैकेज और गहन शिक्षण मॉडल के साथ खेल सकते हैं ।

cat_vector = vectors.query('cat')
print(cat_vector)

हमारे एपीआई के मूल के लिए, हम दो शब्दों के बीच अर्थ में अंतर को वापस करने के लिए एक फ़ंक्शन को परिभाषित करेंगे। यह अनुशंसा इंजन (जैसे शब्दों के साथ सामग्री दिखाना) जैसी चीजों के लिए सबसे गहन सीखने के समाधान के लिए रीढ़ है।

हम फ़ंक्शन similarityऔर most_similar फ़ंक्शन का उपयोग करके इस फ़ंक्शन के साथ खेल सकते हैं ।

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

हम समानता कैलकुलेटर को निम्नानुसार लागू करते हैं। इस विधि को अगले खंड में फ्लास्क एपीआई द्वारा बुलाया जाएगा। ध्यान दें कि यह फ़ंक्शन 0 और 1 के बीच एक वास्तविक मान लौटाता है।

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

REST API बनाना

हम service.pyनिम्नलिखित सामग्री के साथ एक फ़ाइल में अपना सर्वर बनाएंगे । हम आयात करते हैं flaskऔर requestअपनी सर्वर क्षमताओं को संभालने के लिए और हम similarityइंजन को उस मॉड्यूल से आयात करते हैं जो हमने पहले लिखा था।

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

हमारा सर्वर बल्कि नंगे हड्डियां हैं, लेकिन @app.routeडेकोरेटर का उपयोग करके अधिक मार्ग बनाकर आसानी से बढ़ाया जा सकता है ।

एपीआई कॉल बनाना

हम अपने फ्लास्क सर्वर को चलाने के लिए अपने वर्चुअल वातावरण को सक्रिय करने के लिए, अपने पैकेजों को स्थापित करने और इसकी संबंधित पायथन फाइल को चलाने के लिए निम्न कमांड चला सकते हैं।

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

हमारे सर्वर पर उपलब्ध होगा localhost:8000। हम अपने डेटाबेस को क्वेरी कर सकते हैं localhost:8000/similarity?word1=cat&word2=dogऔर हमारे ब्राउज़र में या किसी अन्य AJAX क्लाइंट के माध्यम से प्रतिक्रिया देख सकते हैं ।



Leave a Comment

Ubuntu 16.04 पर लाइटकार्ट शॉपिंग कार्ट प्लेटफ़ॉर्म कैसे स्थापित करें

Ubuntu 16.04 पर लाइटकार्ट शॉपिंग कार्ट प्लेटफ़ॉर्म कैसे स्थापित करें

LiteCart PHP, jQuery और HTML में लिखा गया एक स्वतंत्र और ओपन सोर्स शॉपिंग कार्ट प्लेटफॉर्म है। यह ई-कॉमर्स सॉफ्टवेअर का उपयोग करने के लिए एक सरल, हल���का और आसान है

डेबियन पर सेटअप NFS शेयर

डेबियन पर सेटअप NFS शेयर

एनएफएस एक नेटवर्क-आधारित फाइल सिस्टम है जो कंप्यूटरों को कंप्यूटर नेटवर्क पर फाइलों तक पहुंचने की अनुमति देता है। यह मार्गदर्शिका बताती है कि आप एनएफ पर फ़ोल्डर्स को कैसे उजागर कर सकते हैं

मोटोमो एनालिटिक्स को फेडोरा 28 पर कैसे स्थापित करें

मोटोमो एनालिटिक्स को फेडोरा 28 पर कैसे स्थापित करें

एक अलग प्रणाली का उपयोग? माटोमो (पूर्व में पिविक) एक ओपन सोर्स एनालिटिक्स प्लेटफॉर्म है, जो गूगल एनालिटिक्स का एक खुला विकल्प है। Matomo स्रोत को होस्ट किया गया है

Linux पर एक TeamTalk Server सेटअप करें

Linux पर एक TeamTalk Server सेटअप करें

टीमटॉक एक कॉन्फ्रेंसिंग प्रणाली है जो उपयोगकर्ताओं को उच्च-गुणवत्ता वाले ऑडियो / वीडियो वार्तालाप, टेक्स्ट चैट, स्थानांतरण फ़ाइलें और स्क्रीन साझा करने की अनुमति देती है। यह मैं

कैसे स्थापित करें और अपने CentOS 7 सर्वर पर CyberPanel कॉन्फ़िगर करें

कैसे स्थापित करें और अपने CentOS 7 सर्वर पर CyberPanel कॉन्फ़िगर करें

एक अलग प्रणाली का उपयोग? परिचय CyberPanel बाजार पर पहला नियंत्रण पैनल है जो दोनों खुला स्रोत है और OpenLiteSpeed ​​का उपयोग करता है। क्या थी?

SSH का उपयोग करके LUKS डिस्क एन्क्रिप्शन पर LVM को दूरस्थ रूप से अनलॉक करने के लिए CentOS 7 स्थापित और सेटअप करें

SSH का उपयोग करके LUKS डिस्क एन्क्रिप्शन पर LVM को दूरस्थ रूप से अनलॉक करने के लिए CentOS 7 स्थापित और सेटअप करें

एलयूकेएस (लिनक्स यूनिफाइड की सेटअप) लिनक्स के लिए उपलब्ध विभिन्न डिस्क एन्क्रिप्शन प्रारूपों में से एक है जो प्लेटफॉर्म एग्नॉस्टिक है। यह ट्यूटोरियल आपको बुद्धि प्रदान करेगा

अपने Vultr VPS को कैसे एक्सेस करें

अपने Vultr VPS को कैसे एक्सेस करें

Vultr अपने VPS को कॉन्फ़िगर करने, स्थापित करने और उपयोग करने के लिए कई अलग-अलग तरीके प्रदान करता है। क्रेडेंशियल एक्सेस करें आपके VPS के लिए डिफ़ॉल्ट एक्सेस क्रेडेंशियल ar

उबंटू 16.04 एलटीएस पर एक इंस्पिरैकड आईआरसी सर्वर स्थापित करना

उबंटू 16.04 एलटीएस पर एक इंस्पिरैकड आईआरसी सर्वर स्थापित करना

इंटरनेट रिले चैट (आईआरसी) एक ऐसी चीज है जो इंटरनेट के शुरुआती दिनों से आसपास है। इस गाइड में, मैं आपको आईआर सेटअप करने का तरीका दिखाऊंगा

उबटन 18.04 एलटीएस पर स्रोत से ब्रोथली का निर्माण कैसे करें

उबटन 18.04 एलटीएस पर स्रोत से ब्रोथली का निर्माण कैसे करें

एक अलग प्रणाली का उपयोग? ब्रेटली एक नई संपीड़न विधि है जिसमें GZIP से बेहतर संपीड़न अनुपात है। इसका स्रोत कोड सार्वजनिक रूप से इस Githu पर होस्ट किया गया है

डेबियन 7 पर MySQL के दृश्यों का उपयोग करना

डेबियन 7 पर MySQL के दृश्यों का उपयोग करना

परिचय MySQL में विचारों के रूप में एक महान विशेषता है। दृश्य संग्रहीत प्रश्न हैं। अन्यथा लंबी क्वेरी के लिए उन्हें एक उपनाम के रूप में सोचें। इस गाइड में,

कैसे एक Ubuntu 16.04 दीपक वीपीएस पर सबरियन 4.1 सीएमएस स्थापित करने के लिए

कैसे एक Ubuntu 16.04 दीपक वीपीएस पर सबरियन 4.1 सीएमएस स्थापित करने के लिए

एक अलग प्रणाली का उपयोग? सबरियन 4.1 सीएमएस एक शक्तिशाली और लचीला खुला स्रोत कंटेंट मैनेजमेंट सिस्टम (सीएमएस) है जो सहज और स्पष्ट रूप से सामने लाता है

Ubuntu 16.04 LTS पर DokuWiki को कैसे स्थापित करें

Ubuntu 16.04 LTS पर DokuWiki को कैसे स्थापित करें

एक अलग प्रणाली का उपयोग? DokuWiki PHP में लिखा एक खुला स्रोत विकी प्रोग्राम है जिसमें एक डेटाबेस की आवश्यकता नहीं होती है। यह पाठ फ़ाइलों में डेटा संग्रहीत करता है। DokuWik

डेबियन पर चेरोट की स्थापना

डेबियन पर चेरोट की स्थापना

यह आलेख आपको सिखाएगा कि डेबियन पर चेरोट जेल कैसे सेट करें। मुझे लगता है कि आप डेबियन 7.x का उपयोग कर रहे हैं यदि आप डेबियन 6 या 8 चला रहे हैं, तो यह काम कर सकता है, बू

डेबियन पर PiVPN कैसे स्थापित करें

डेबियन पर PiVPN कैसे स्थापित करें

परिचय डेबियन पर वीपीएन सर्वर स्थापित करने का एक आसान तरीका PiVPN के साथ है। PiVPN OpenVPN के लिए एक इंस्टॉलर और आवरण है। यह आपके लिए सरल कमांड बनाता है

डेबियन 9 पर GitLab सामुदायिक संस्करण (CE) 11.x कैसे स्थापित करें

डेबियन 9 पर GitLab सामुदायिक संस्करण (CE) 11.x कैसे स्थापित करें

एक अलग प्रणाली का उपयोग? चूंकि GitHub को Microsoft द्वारा अधिग्रहित किया गया था, काफी कुछ डेवलपर्स ने अपने स्वयं के कोड रिपॉजिटरी को github.co से माइग्रेट करने की योजना बनाई है

डेबियन 8 पर एक फ्लैश 5 में पीबीएक्स स्थापित करें

डेबियन 8 पर एक फ्लैश 5 में पीबीएक्स स्थापित करें

PBX इन ए फ्लैश 5 (PIAF5) एक डेबियन 8 आधारित ऑपरेटिंग सिस्टम है जो आपके Vultr VPS को पूर्ण विकसित PBX में बदल देता है। इसके पास निम्नलिखित विशेषताएं हैं, और बहुत कुछ।

Ubuntu 18.04 LTS पर CyberPanel को कैसे इनस्टॉल और कॉन्फ़िगर करें

Ubuntu 18.04 LTS पर CyberPanel को कैसे इनस्टॉल और कॉन्फ़िगर करें

एक अलग प्रणाली का उपयोग? परिचय CyberPanel बाजार पर पहला नियंत्रण पैनल है जो दोनों खुला स्रोत है और OpenLiteSpeed ​​का उपयोग करता है। क्या थी?

Fedora 25 पर घोस्ट v0.11 LTS को कैसे नियुक्त करें

Fedora 25 पर घोस्ट v0.11 LTS को कैसे नियुक्त करें

एक अलग प्रणाली का उपयोग? घोस्ट एक ओपन सोर्स ब्लॉगिंग प्लेटफॉर्म है जो अपने 201 के बाद से डेवलपर्स और आम उपयोगकर्ताओं के बीच लोकप्रियता हासिल कर रहा है

CentOS 7 पर RockMongo स्थापित करें

CentOS 7 पर RockMongo स्थापित करें

RockMongo एक वेब-आधारित MongoDB प्रबंधन उपकरण है जो MySQL प्रबंधन उपकरण के समान है: phpMyAdmin। यह ट्यूटोरियल इंस्टॉलिन की प्रक्रिया को कवर करेगा

कैसे आर्कब लिनक्स पर MariaDB 10.3 या MySQL 8.0 स्थापित करें

कैसे आर्कब लिनक्स पर MariaDB 10.3 या MySQL 8.0 स्थापित करें

किसी और Vultr सर्वर को आर्क लिनक्स (इस लेख को देखें) तक चला रहे हैं। सूडो पहुंच: रूट के रूप में चलाने के लिए आवश्यक कमांड #, और एक द्वारा उपसर्ग किए जाते हैं।

Ubuntu 16.04 पर लाइटकार्ट शॉपिंग कार्ट प्लेटफ़ॉर्म कैसे स्थापित करें

Ubuntu 16.04 पर लाइटकार्ट शॉपिंग कार्ट प्लेटफ़ॉर्म कैसे स्थापित करें

LiteCart PHP, jQuery और HTML में लिखा गया एक स्वतंत्र और ओपन सोर्स शॉपिंग कार्ट प्लेटफॉर्म है। यह ई-कॉमर्स सॉफ्टवेअर का उपयोग करने के लिए एक सरल, हल���का और आसान है

डेबियन पर सेटअप NFS शेयर

डेबियन पर सेटअप NFS शेयर

एनएफएस एक नेटवर्क-आधारित फाइल सिस्टम है जो कंप्यूटरों को कंप्यूटर नेटवर्क पर फाइलों तक पहुंचने की अनुमति देता है। यह मार्गदर्शिका बताती है कि आप एनएफ पर फ़ोल्डर्स को कैसे उजागर कर सकते हैं

मोटोमो एनालिटिक्स को फेडोरा 28 पर कैसे स्थापित करें

मोटोमो एनालिटिक्स को फेडोरा 28 पर कैसे स्थापित करें

एक अलग प्रणाली का उपयोग? माटोमो (पूर्व में पिविक) एक ओपन सोर्स एनालिटिक्स प्लेटफॉर्म है, जो गूगल एनालिटिक्स का एक खुला विकल्प है। Matomo स्रोत को होस्ट किया गया है

Linux पर एक TeamTalk Server सेटअप करें

Linux पर एक TeamTalk Server सेटअप करें

टीमटॉक एक कॉन्फ्रेंसिंग प्रणाली है जो उपयोगकर्ताओं को उच्च-गुणवत्ता वाले ऑडियो / वीडियो वार्तालाप, टेक्स्ट चैट, स्थानांतरण फ़ाइलें और स्क्रीन साझा करने की अनुमति देती है। यह मैं

विंडोज सर्वर पर Garrys मॉड कैसे स्थापित करें

विंडोज सर्वर पर Garrys मॉड कैसे स्थापित करें

परिचय यह आलेख बताएगा कि विंडोज सर्वर 2012 पर गारस मोड सर्वर को कैसे डाउनलोड और इंस्टॉल किया जाए। यह गाइड गहराई में होने के लिए बनाया गया है।

कैसे स्थापित करें और अपने CentOS 7 सर्वर पर CyberPanel कॉन्फ़िगर करें

कैसे स्थापित करें और अपने CentOS 7 सर्वर पर CyberPanel कॉन्फ़िगर करें

एक अलग प्रणाली का उपयोग? परिचय CyberPanel बाजार पर पहला नियंत्रण पैनल है जो दोनों खुला स्रोत है और OpenLiteSpeed ​​का उपयोग करता है। क्या थी?

CentOS पर FFmpeg कैसे स्थापित करें

CentOS पर FFmpeg कैसे स्थापित करें

FFmpeg ऑडियो और वीडियो रिकॉर्ड करने, कन्वर्ट करने और स्ट्रीम करने के लिए एक लोकप्रिय ओपन सोर्स समाधान है, जो सभी प्रकार की ऑनलाइन स्ट्रीमिंग सेवाओं में व्यापक रूप से उपयोग किया जाता है। मैं

SSH का उपयोग करके LUKS डिस्क एन्क्रिप्शन पर LVM को दूरस्थ रूप से अनलॉक करने के लिए CentOS 7 स्थापित और सेटअप करें

SSH का उपयोग करके LUKS डिस्क एन्क्रिप्शन पर LVM को दूरस्थ रूप से अनलॉक करने के लिए CentOS 7 स्थापित और सेटअप करें

एलयूकेएस (लिनक्स यूनिफाइड की सेटअप) लिनक्स के लिए उपलब्ध विभिन्न डिस्क एन्क्रिप्शन प्रारूपों में से एक है जो प्लेटफॉर्म एग्नॉस्टिक है। यह ट्यूटोरियल आपको बुद्धि प्रदान करेगा

अपने Vultr VPS को कैसे एक्सेस करें

अपने Vultr VPS को कैसे एक्सेस करें

Vultr अपने VPS को कॉन्फ़िगर करने, स्थापित करने और उपयोग करने के लिए कई अलग-अलग तरीके प्रदान करता है। क्रेडेंशियल एक्सेस करें आपके VPS के लिए डिफ़ॉल्ट एक्सेस क्रेडेंशियल ar

CentOS 7 पर अक्टूबर CMS को कैसे स्थापित करें

CentOS 7 पर अक्टूबर CMS को कैसे स्थापित करें

अक्टूबर एक खुला स्रोत सामग्री प्रबंधन प्रणाली है जो लारवेल PHP फ्रेमवर्क पर आधारित है। एक सुरुचिपूर्ण इंटरफ़ेस और एक संक्षिप्त मॉड्यूलर वास्तुकला के साथ