Word2Vec 및 Flask를 사용하여 딥 러닝 REST API를 만드는 방법

생산에서 복잡한 기계 학습 모델을 사용할 때 개발에 대한 기존의 접근 방식을 유지하기가 어렵습니다. 랩탑 또는 로컬 머신에서의 개발은 딥 러닝 엔지니어를위한 머신 러닝 모델을 훈련시키는 데 느릴 수 있습니다. 결과적으로, 우리는 일반적으로 머신 러닝 모델을 교육하고 실행하기 위해보다 강력한 하드웨어를 갖춘 클라우드 머신을 사용합니다. 복잡한 계산을 추상화하고 필요에 따라 AJAX 요청을하기 때문에 이는 좋은 방법입니다. 이 자습서에서는 처음부터 REST API를 작성하여 다른 서비스에서 Word2Vec이라는 사전 훈련 된 딥 러닝 모델을 사용할 수 있도록합니다.

전제 조건

  • RAM이 4GB 이상인 Ubuntu 16.04 서버 인스턴스 테스트 및 개발 목적으로 4GB RAM이있는 인스턴스를 선택할 수 있습니다.
  • Linux 운영 체제를 사용하여 폴더 및 파일을 작성 / 탐색 / 편집하는 방법에 대한 이해
  • sudo사용자

단어 임베딩이란 무엇입니까?

단어 임베딩은 자연 언어 처리 및 딥 러닝의 최근 개발로, 빠른 발전으로 인해 두 분야에 혁명을 일으켰습니다. 워드 임베딩은 본질적으로 각각 벡터가 단어를 의미하도록 단일 단어에 대응하는 벡터이다. 에 대한 벡터와 같은 특정 현상으로이를 입증 할 수 있습니다 king - queen = boy - girl. 단어 벡터는 추천 엔진에서 실제로 영어를 이해하는 챗봇에 이르기까지 모든 것을 구축하는 데 사용됩니다.

단어 삽입은 무작위가 아닙니다. 그것들은 신경망을 훈련시킴으로써 생성됩니다. 최근 강력한 단어 임베딩 구현은 Google에서 Word2Vec이라는 이름으로 제공되며 언어에서 다른 단어 옆에 나타나는 단어를 예측하여 학습됩니다. 예를 들어, 단어 "cat"의 경우 신경망은 단어 "kitten"및 을 예측합니다 "feline". 서로 가까이 나타나는 단어의 직관은 우리가 단어를 벡터 공간에 배치 할 수있게합니다.

그러나 실제로는 Google과 같은 다른 대기업의 사전 훈련 된 모델을 사용하여 신속하게 프로토 타입을 작성하고 배포 프로세스를 단순화하는 경향이 있습니다. 이 자습서에서는 Google의 Word2Vec 사전 훈련 된 단어 임베딩을 다운로드하여 사용합니다. 작업 디렉토리에서 다음 명령을 실행하여이를 수행 할 수 있습니다.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

플라스크 및 크기 패키지 설치

우리가 다운로드 한 단어 포함 모델은 .magnitude형식입니다. 이 형식을 사용하면 SQL을 사용하여 모델을 효율적으로 쿼리 할 수 ​​있으므로 프로덕션 서버에 가장 적합한 임베딩 형식입니다. .magnitude형식 을 읽을 수 있어야 하므로 pymagnitude패키지를 설치합니다 . 또한 flask나중에 모델이 만든 딥 러닝 예측을 제공하기 위해 설치 합니다.

pip3 install pymagnitude flask

또한 다음 명령을 사용하여 종속성 추적기에 추가합니다. 그러면 이름이 지정된 파일이 만들어 requirements.txt지고 나중에 다시 설치할 수 있도록 Python 라이브러리가 저장됩니다.

pip3 freeze > requirements.txt

Word2Vec 모델 쿼리

시작하기 위해 단어 임베딩을 열고 쿼리하는 파일을 작성합니다.

touch model.py

다음으로 model.pyMagnitude를 가져 오기 위해 다음 줄을 추가합니다 .

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

우리는 방법 pymagnitude을 사용하여 패키지와 딥 러닝 모델을 가지고 놀 수 query있으며 단어에 대한 인수를 제공합니다.

cat_vector = vectors.query('cat')
print(cat_vector)

API의 핵심을 위해 두 단어의 의미 차이를 반환하는 함수를 정의합니다. 추천 엔진 (예 : 비슷한 단어로 콘텐츠 표시)과 같은 것들에 대한 대부분의 딥 러닝 솔루션의 중추입니다.

similarityand most_similar 기능 을 사용하여이 기능을 사용할 수 있습니다.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

유사도 계산기는 다음과 같이 구현합니다. 이 메소드는 다음 섹션에서 Flask API에 의해 호출됩니다. 이 함수는 0과 1 사이의 실수 값을 반환합니다.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

REST API 작성

service.py다음 내용으로 이름이 지정된 파일로 서버를 만듭니다 . 우리는 수입 flaskrequest우리의 서버 기능을 처리하기 위해 우리는 가져 similarity우리가 이전에 쓴 모듈의 엔진을.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

우리의 서버는 다소 뼈가 있지만 @app.route데코레이터를 사용하여 더 많은 경로를 만들어 쉽게 확장 할 수 있습니다 .

API 호출

가상 환경을 활성화하고 패키지를 설치하고 관련 Python 파일을 실행하려면 다음 명령을 실행하여 Flask 서버를 실행할 수 있습니다.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

우리 서버는에서 사용할 수 있습니다 localhost:8000. localhost:8000/similarity?word1=cat&word2=dog브라우저에서 또는 다른 AJAX 클라이언트를 통해 데이터베이스를 쿼리하고 응답을 볼 수 있습니다 .



Leave a Comment

Ubuntu 16.04에 LiteCart 쇼핑 카트 플랫폼을 설치하는 방법

Ubuntu 16.04에 LiteCart 쇼핑 카트 플랫폼을 설치하는 방법

LiteCart는 PHP, jQuery 및 HTML 5로 작성된 무료 오픈 소스 쇼핑 카트 플랫폼입니다. 단순하고 가벼우 며 사용하기 쉬운 전자 상거래 softwar입니다

데비안에서 NFS 공유 설정

데비안에서 NFS 공유 설정

NFS는 컴퓨터가 컴퓨터 네트워크를 통해 파일에 액세스 할 수 있도록하는 네트워크 기반 파일 시스템입니다. 이 가이드는 NF를 통해 폴더를 노출하는 방법을 설명합니다

Fedora 28에 Matomo Analytics를 설치하는 방법

Fedora 28에 Matomo Analytics를 설치하는 방법

다른 시스템을 사용하십니까? Matomo (이전 Piwik)는 Google 애널리틱스의 대안 인 오픈 소스 분석 플랫폼입니다. Matomo 소스가 호스팅됩니다

Linux에서 TeamTalk 서버 설정

Linux에서 TeamTalk 서버 설정

TeamTalk는 사용자가 고품질 오디오 / 비디오 대화, 문자 채팅, 파일 전송 및 화면 공유를 할 수있는 회의 시스템입니다. 내가

CentOS 7 서버에 CyberPanel을 설치하고 구성하는 방법

CentOS 7 서버에 CyberPanel을 설치하고 구성하는 방법

다른 시스템을 사용하십니까? 소개 CyberPanel은 오픈 소스이며 OpenLiteSpeed를 사용하는 최초의 제어판 중 하나입니다. 무슨 티

Ubuntu 17.04에서 Rbenv, Rails, MariaDB, Nginx, SSL 및 승객으로 Ruby를 설치 및 구성하는 방법

Ubuntu 17.04에서 Rbenv, Rails, MariaDB, Nginx, SSL 및 승객으로 Ruby를 설치 및 구성하는 방법

Ruby on Rails는 프로그래머의 생산성을 높이기 위해 개발 된 Ruby의 대중적인 웹 프레임 워크입니다. 그러나 다양한 보석과 의존성 확보

Vultr VPS에 액세스하는 방법

Vultr VPS에 액세스하는 방법

Vultr은 VPS에 액세스하여 구성, 설치 및 사용하는 여러 가지 방법을 제공합니다. 액세스 자격 증명 VPS ar의 기본 액세스 자격 증명

Ubuntu 16.04 LTS에 OpenNMS를 설치하는 방법

Ubuntu 16.04 LTS에 OpenNMS를 설치하는 방법

다른 시스템을 사용하십니까? OpenNMS는 엔터프라이즈 급 오픈 소스 네트워크 관리 플랫폼으로 여러 장치를 모니터링하고 관리하는 데 사용할 수 있습니다

Fedora 26 LAMP VPS에 Omeka Classic 2.4 CMS를 설치하는 방법

Fedora 26 LAMP VPS에 Omeka Classic 2.4 CMS를 설치하는 방법

다른 시스템을 사용하십니까? Omeka Classic 2.4 CMS는 디지털 공유를위한 무료 오픈 소스 디지털 출판 플랫폼 및 CMS (콘텐츠 관리 시스템)입니다

Ubuntu 16.04 LTS에 DokuWiki를 설치하는 방법

Ubuntu 16.04 LTS에 DokuWiki를 설치하는 방법

다른 시스템을 사용하십니까? DokuWiki는 데이터베이스가 필요없는 PHP로 작성된 오픈 소스 위키 프로그램입니다. 텍스트 파일에 데이터를 저장합니다. 도쿠 위크

코골이가있는 앞마당 2 설정

코골이가있는 앞마당 2 설정

Barnyard2는 Snort의 바이너리 출력을 MySQL 데이터베이스에 저장하고 처리하는 방법입니다. 시작하기 전에 코골이가 없으면

데비안에서 Chroot 설정

데비안에서 Chroot 설정

이 기사는 데비안에서 chroot jail을 설정하는 방법을 알려줍니다. 데비안 7.x를 사용한다고 가정합니다. 데비안 6 또는 8을 실행하고 있다면 작동 할 수 있습니다.

데비안에 PiVPN을 설치하는 방법

데비안에 PiVPN을 설치하는 방법

소개 데비안에서 VPN 서버를 설정하는 쉬운 방법은 PiVPN을 사용하는 것입니다. PiVPN은 OpenVPN 용 설치 프로그램 및 래퍼입니다. 그것은 당신을 위해 간단한 명령을 만듭니다

Ubuntu 18.04 LTS에서 CyberPanel을 설치하고 구성하는 방법

Ubuntu 18.04 LTS에서 CyberPanel을 설치하고 구성하는 방법

다른 시스템을 사용하십니까? 소개 CyberPanel은 오픈 소스이며 OpenLiteSpeed를 사용하는 최초의 제어판 중 하나입니다. 무슨 티

Fedora 25에서 Ghost v0.11 LTS를 배포하는 방법

Fedora 25에서 Ghost v0.11 LTS를 배포하는 방법

다른 시스템을 사용하십니까? Ghost는 201 년 이후 개발자와 일반 사용자 사이에서 인기를 얻고있는 오픈 소스 블로그 플랫폼입니다.

CentOS 7에 채팅 서버를 배포하는 방법

CentOS 7에 채팅 서버를 배포하는 방법

Lets Chat은 소규모 팀을위한 자체 호스팅 메시징 서비스를 제공하도록 설계된 오픈 소스 채팅 응용 프로그램입니다. 채팅이 NodeJS 및 MongoDB를 기반으로 함

CentOS 7에 예약 스케줄러를 설치하는 방법

CentOS 7에 예약 스케줄러를 설치하는 방법

다른 시스템을 사용하십니까? 전제 조건 Vultr CentOS 7 서버 인스턴스. sudo 사용자 1 단계 : 시스템 업데이트 먼저 시스템 서버를 업데이트하십시오.

데비안 9의 소스에서 Brotli를 빌드하는 방법

데비안 9의 소스에서 Brotli를 빌드하는 방법

다른 시스템을 사용하십니까? Brotli는 Gzip보다 압축률이 더 좋은 새로운 압축 방법입니다. 소스 코드는 Github에서 공개적으로 호스팅됩니다. 티

Plesk 서버에서 HTTP / 2를 활성화하는 방법

Plesk 서버에서 HTTP / 2를 활성화하는 방법

Plesk는 기본 HTTP / 2를 지원합니다. Plesk에서 HTTP / 2를 롤아웃하는 것이 다른 방법에 비해 훨씬 쉽지만 배치 프로세스에는 신중한 계획이 필요합니다.

FreeBSD 12에서 osTicket을 설치하는 방법

FreeBSD 12에서 osTicket을 설치하는 방법

다른 시스템을 사용하십니까? osTicket은 오픈 소스 고객 지원 티켓팅 시스템입니다. osTicket 소스 코드는 Github에서 공개적으로 호스팅됩니다. 이 튜토리얼에서

NTLite를 사용하여 업데이트로 Windows 사용자 지정 ISO를 만드는 방법

NTLite를 사용하여 업데이트로 Windows 사용자 지정 ISO를 만드는 방법

NTLite를 사용하여 Vultr 시스템과 호환되는 Windows 사용자 지정 ISO를 만드는 방법을 단계별로 설명합니다. 최신 드라이버와 업데이트 통합을 포함한 완벽 가이드.

Vultr에서 BGP 구성

Vultr에서 BGP 구성

Vultr BGP 설정을 위한 단계별 튜토리얼. ASN 할당부터 IP 라우팅 구성, BIRD 데몬 설정, FreeBSD 특이사항 및 실전 문제 해결 팁 7가지 포함한 최종 가이드

WsgiDAV를 사용하여 Debian 10에 WebDAV 배포

WsgiDAV를 사용하여 Debian 10에 WebDAV 배포

WebDAV (Web Distributed Authoring and Versioning)를 이용한 원격 파일 작성을 위한 프레임워크로, WsgiDAV 설치 및 구성 방법을 안내합니다.

데비안 7에 Mailcow 설치

데비안 7에 Mailcow 설치

Mailcow는 DoveCot, Postfix 및 기타 여러 오픈 소스 패키지를 기반으로 하는 경량 메일 서버입니다. 데비안에서 Mailcow 설치 방법을 안내합니다.

AI가 랜섬웨어 공격의 증가와 싸울 수 있습니까?

AI가 랜섬웨어 공격의 증가와 싸울 수 있습니까?

랜섬웨어 공격이 증가하고 있지만 AI가 최신 컴퓨터 바이러스를 처리하는 데 도움이 될 수 있습니까? AI가 답인가? AI boone 또는 bane인지 여기에서 읽으십시오.

ReactOS: 이것이 Windows의 미래입니까?

ReactOS: 이것이 Windows의 미래입니까?

오픈 소스이자 무료 운영 체제인 ReactOS가 최신 버전과 함께 제공됩니다. 현대 Windows 사용자의 요구 사항을 충족하고 Microsoft를 무너뜨릴 수 있습니까? 이 구식이지만 더 새로운 OS 환경에 대해 자세히 알아보겠습니다.

WhatsApp 데스크톱 앱 24*7을 통해 연결 유지

WhatsApp 데스크톱 앱 24*7을 통해 연결 유지

Whatsapp은 마침내 Mac 및 Windows 사용자용 데스크톱 앱을 출시했습니다. 이제 Windows 또는 Mac에서 Whatsapp에 쉽게 액세스할 수 있습니다. Windows 8 이상 및 Mac OS 10.9 이상에서 사용 가능

AI는 어떻게 프로세스 자동화를 다음 단계로 끌어올릴 수 있습니까?

AI는 어떻게 프로세스 자동화를 다음 단계로 끌어올릴 수 있습니까?

인공 지능이 소규모 회사에서 어떻게 인기를 얻고 있으며 어떻게 인공 지능이 성장할 가능성을 높이고 경쟁자가 우위를 점할 수 있는지 알아보려면 이 기사를 읽으십시오.

macOS Catalina 10.15.4 추가 업데이트로 인해 해결보다 더 많은 문제가 발생함

macOS Catalina 10.15.4 추가 업데이트로 인해 해결보다 더 많은 문제가 발생함

최근 Apple은 문제를 해결하기 위해 macOS Catalina 10.15.4 추가 업데이트를 출시했지만 이 업데이트로 인해 Mac 컴퓨터의 브릭킹으로 이어지는 더 많은 문제가 발생하는 것 같습니다. 자세히 알아보려면 이 기사를 읽어보세요.

빅데이터의 13가지 상용 데이터 추출 도구

빅데이터의 13가지 상용 데이터 추출 도구

빅데이터의 13가지 상용 데이터 추출 도구