Como criar uma API REST de Deep Learning com Word2Vec e Flask

Pré-requisitos
O que são casamentos com palavras?
Instalando os pacotes Flask e Magnitude
Consultando o modelo Word2Vec
Criando uma API REST
Fazendo chamadas de API

As abordagens tradicionais de desenvolvimento são difíceis de manter ao usar modelos complexos de aprendizado de máquina na produção. O desenvolvimento em um laptop ou máquina local pode ser lento para treinar o modelo de aprendizado de máquina para engenheiros de aprendizado profundo. Como resultado, normalmente usamos máquinas em nuvem com hardware mais poderoso para treinar e executar nossos modelos de aprendizado de máquina. Essa é uma boa prática, pois abstraímos a computação complexa e, em vez disso, fazemos solicitações AJAX conforme necessário. Neste tutorial, disponibilizaremos um modelo de aprendizado profundo pré-treinado chamado Word2Vec para outros serviços, criando uma API REST desde o início.

Pré-requisitos

Uma instância do servidor Ubuntu 16.04 com pelo menos 4 GB de RAM. Para fins de teste e desenvolvimento, você pode escolher uma instância com 4 GB de RAM
Compreensão de como usar o sistema operacional Linux para criar / navegar / editar pastas e arquivos
Um sudousuário

O que são casamentos com palavras?

A incorporação de palavras é um desenvolvimento recente no processamento de linguagem natural e aprendizado profundo que revolucionou os dois campos devido ao rápido progresso. Incorporações de palavras são essencialmente vetores que correspondem a uma única palavra, de modo que os vetores significam as palavras. Isso pode ser demonstrado por certos fenômenos, como o vetor para king - queen = boy - girl. Os vetores de palavras são usados para criar tudo, de mecanismos de recomendação a bots de bate-papo que realmente entendem o idioma inglês.

Os casamentos de palavras não são aleatórios; eles são gerados treinando uma rede neural. Uma implementação recente e poderosa de incorporação de palavras vem do Google, chamada Word2Vec, que é treinada prevendo palavras que aparecem ao lado de outras palavras em um idioma. Por exemplo, para a palavra "cat", a rede neural irá prever as palavras "kitten"e "feline". Essa intuição de palavras que aparecem próximas umas das outras nos permite colocá-las no espaço vetorial.

No entanto, na prática, tendemos a usar os modelos pré-treinados de outras grandes empresas, como o Google, para prototipar rapidamente e simplificar os processos de implantação. Neste tutorial, faremos o download e usaremos as combinações pré-treinadas de palavras do Word2Vec do Google. Podemos fazer isso executando o seguinte comando em nosso diretório de trabalho.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Instalando os pacotes Flask e Magnitude

O modelo de incorporação de palavras que baixamos está em um .magnitudeformato. Esse formato nos permite consultar o modelo com eficiência usando SQL e, portanto, é o formato de incorporação ideal para servidores de produção. Como precisamos ler o .magnitudeformato, instalaremos o pymagnitudepacote. Também instalaremos flaskpara servir posteriormente as previsões de aprendizado profundo feitas pelo modelo.

pip3 install pymagnitude flask

Também o adicionaremos ao nosso rastreador de dependência com o seguinte comando. Isso cria um arquivo nomeado requirements.txte salva nossas bibliotecas Python para que possamos reinstalá-las posteriormente.

pip3 freeze > requirements.txt

Consultando o modelo Word2Vec

Para começar, criaremos um arquivo para lidar com a abertura e a consulta da palavra incorporação.

touch model.py

Em seguida, adicionaremos as seguintes linhas model.pypara importar o Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Podemos brincar com o pymagnitudepacote e o modelo de aprendizado profundo usando o querymétodo, fornecendo um argumento para uma palavra.

cat_vector = vectors.query('cat')
print(cat_vector)

Para o núcleo da nossa API, definiremos uma função para retornar a diferença de significado entre duas palavras. Essa é a espinha dorsal das soluções de aprendizado mais profundo para coisas como mecanismos de recomendação (ou seja, exibir conteúdo com palavras semelhantes).

Podemos brincar com essa função usando as funções similaritye most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Implementamos a calculadora de similaridade da seguinte maneira. Este método será chamado pela API do Flask na próxima seção. Observe que essa função retorna um valor real entre 0 e 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Criando uma API REST

Criaremos nosso servidor em um arquivo nomeado service.pycom o seguinte conteúdo. Importamos flaske requestmanipulamos os recursos do servidor e importamos o similaritymecanismo do módulo que escrevemos anteriormente.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Nosso servidor é bastante simples, mas pode ser facilmente estendido criando mais rotas usando o @app.routedecorador.

Fazendo chamadas de API

Podemos executar nosso servidor Flask executando os seguintes comandos para ativar nosso ambiente virtual, instalar nossos pacotes e executar seu arquivo Python associado.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Nosso servidor estará disponível em localhost:8000. Podemos consultar nosso banco de dados em localhost:8000/similarity?word1=cat&word2=doge visualizar a resposta em nosso navegador ou através de outro cliente AJAX.

Tags: #Linux Guides #Machine Learning #Programming #Python

Comment *

Name *

Website

Como instalar a plataforma LiteCart Shopping Cart no Ubuntu 16.04

LiteCart é uma plataforma de carrinho de compras de código aberto e gratuita escrita em PHP, jQuery e HTML 5. É um software de comércio eletrônico simples, leve e fácil de usar

Configuração inicial segura do servidor Ubuntu 18.04

Introdução Neste tutorial, você aprenderá como configurar um nível básico de segurança em uma nova máquina virtual Vultr VC2 executando o Ubunt

Instalando o McMyAdmin no Ubuntu 14.10

McMyAdmin é um painel de controle do servidor Minecraft usado para administrar seu servidor. Embora o McMyAdmin seja gratuito, há várias edições, algumas das quais são pai

Configurar um TeamTalk Server no Linux

O TeamTalk é um sistema de conferência que permite aos usuários ter conversas de áudio / vídeo de alta qualidade, bate-papo por texto, transferir arquivos e compartilhar telas. É eu

Como instalar e configurar o CyberPanel no servidor CentOS 7

Usando um sistema diferente? Introdução O CyberPanel é um dos primeiros painéis de controle do mercado, tanto de código aberto quanto de OpenLiteSpeed. What thi

Instale o Grafana no Ubuntu 16.04 LTS

Usando um sistema diferente? Introdução O Grafana é um software de código aberto que transforma vários feeds de sistemas como Graphite, Telegraf, um

Instale o phpBB com Apache no Ubuntu 16.04

PhpBB é um programa de boletim de código aberto. Este artigo mostra como instalar o phpBB em cima de um servidor Apache no Ubuntu 16.04. Foi writte

Como instalar o Foreman no Ubuntu 16.04 LTS

Usando um sistema diferente? O Foreman é uma ferramenta gratuita e de código aberto que ajuda na configuração e gerenciamento de servidores físicos e virtuais. Forema

Configurar um usuário não root com Sudo Access no Ubuntu

Ter apenas um usuário, que é root, pode ser perigoso. Então vamos consertar isso. O Vultr nos dá a liberdade de fazer o que quisermos com nossos usuários e servidores

Instale o eSpeak no CentOS 7

Usando um sistema diferente? O ESpeak pode gerar arquivos de áudio de conversão de texto em fala (TTS). Isso pode ser útil por vários motivos, como criar seu próprio Turim

Instalando o Fuel CMS no Ubuntu 16.04 LTS

Usando um sistema diferente? O Fuel CMS é um sistema de gerenciamento de conteúdo baseado em CodeIgniter. Seu código fonte está hospedado no GitHub. Este guia mostra como você pode

Como instalar o Couch CMS 2.0 em um VPS Debian 9 LAMP

Usando um sistema diferente? O Couch CMS é um sistema de gerenciamento de conteúdo (CMS) simples e flexível, gratuito e de código aberto que permite que os web designers

Monitore seus dispositivos usando o LibreNMS no CentOS 7

Usando um sistema diferente? O LibreNMS é um sistema de monitoramento de rede de código aberto completo. Ele usa o SNMP para obter os dados de diferentes dispositivos. Uma variedade

Como usar o Sudo no Debian, CentOS e FreeBSD

Usar um usuário sudo para acessar um servidor e executar comandos no nível raiz é uma prática muito comum entre o Linux e o Unix Systems Administrator. O uso de um sud

Como instalar o RabbitMQ no CentOS 7

Usando um sistema diferente? O RabbitMQ é um intermediário de mensagens de código aberto amplamente usado, escrito na linguagem de programação Erlang. Como um middleware orientado a mensagens

Como ativar o TLS 1.3 no Apache no Fedora 30

Usando um sistema diferente? O TLS 1.3 é uma versão do protocolo TLS (Transport Layer Security) publicada em 2018 como um padrão proposto no RFC 8446

Configurando um Chroot no Debian

Este artigo ensinará como configurar uma prisão chroot no Debian. Presumo que você esteja usando o Debian 7.x. Se você estiver executando o Debian 6 ou 8, isso pode funcionar, mas

Como instalar o PiVPN no Debian

Introdução Uma maneira fácil de configurar um servidor VPN no Debian é com o PiVPN. PiVPN é um instalador e wrapper para o OpenVPN. Ele cria comandos simples para você t

Configurar o Nginx-RTMP no CentOS 7

Usando um sistema diferente? O RTMP é ótimo para veicular conteúdo ao vivo. Quando o RTMP é emparelhado com o FFmpeg, os fluxos podem ser convertidos em várias qualidades. Vultr i

Como instalar e configurar o CyberPanel no Ubuntu 18.04 LTS

Usando um sistema diferente? Introdução O CyberPanel é um dos primeiros painéis de controle do mercado, tanto de código aberto quanto de OpenLiteSpeed. What thi

A IA pode lutar contra o aumento do número de ataques de ransomware

Os ataques de ransomware estão aumentando, mas a IA pode ajudar a lidar com os vírus de computador mais recentes? AI é a resposta? Leia aqui para saber se é AI boone ou bane

ReactOS: Este é o futuro do Windows?

ReactOS, um sistema operacional de código aberto e gratuito está aqui com a versão mais recente. Será que ela pode atender às necessidades dos usuários modernos do Windows e derrubar a Microsoft? Vamos descobrir mais sobre esse estilo antigo, mas uma experiência de sistema operacional mais recente.

Fique conectado por meio do aplicativo WhatsApp Desktop 24 * 7

O Whatsapp finalmente lançou o aplicativo Desktop para usuários de Mac e Windows. Agora você pode acessar o Whatsapp do Windows ou Mac facilmente. Disponível para Windows 8+ e Mac OS 10.9+

Como a IA pode levar a automação de processos ao próximo nível?

Leia isto para saber como a Inteligência Artificial está se tornando popular entre as empresas de pequena escala e como está aumentando as probabilidades de fazê-las crescer e dar vantagem a seus concorrentes.

A atualização do suplemento do macOS Catalina 10.15.4 está causando mais problemas do que resolvendo

Recentemente, a Apple lançou o macOS Catalina 10.15.4, uma atualização suplementar para corrigir problemas, mas parece que a atualização está causando mais problemas, levando ao bloqueio de máquinas mac. Leia este artigo para saber mais

13 Ferramentas de Extração de Dados Comerciais de Big Data

O que é um sistema de arquivos de registro no diário e como ele funciona?

Nosso computador armazena todos os dados de uma maneira organizada conhecida como sistema de arquivos Journaling. É um método eficiente que permite ao computador pesquisar e exibir arquivos assim que você clicar em search.https: //wethegeek.com/? P = 94116 & preview = true

Singularidade tecnológica: um futuro distante da civilização humana?

À medida que a ciência evolui em um ritmo rápido, assumindo muitos de nossos esforços, os riscos de nos sujeitarmos a uma singularidade inexplicável também aumentam. Leia, o que a singularidade pode significar para nós.

Uma visão sobre 26 técnicas analíticas de Big Data: Parte 1

O impacto da inteligência artificial na saúde 2021

A IA na área da saúde deu grandes saltos nas últimas décadas. Portanto, o futuro da IA na área da saúde ainda está crescendo dia a dia.