O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
RethinkDB este o bază de date NoSQL care stochează datele sub formă de documente JSON. Are un limbaj de interogare super intuitiv și are caracteristici disponibile în mod obișnuit în RDBMS tradiționale, cum ar fi „tabel de aderare” și „grup după”. Acest tutorial vă va explica cum să configurați un cluster RethinkDB folosind 3 servere Vultr VPS care rulează Ubuntu 14.04.
Creați un nou script de pornire Vultr utilizând următorul conținut ca șablon.
#!/usr/bin/env bash
echo ">>> Installing RethinkDB<<<"
# Add RethinkDB Repo to list of Repos
source /etc/lsb-release && echo "deb http://download.rethinkdb.com/apt $DISTRIB_CODENAME main" | sudo tee /etc/apt/sources.list.d/rethinkdb.list
wget -qO- http://download.rethinkdb.com/apt/pubkey.gpg | sudo apt-key add -
# Update Apt Repo & Install RethinkDB
sudo apt-get update
sudo apt-get install -qq rethinkdb
Creează o instanță Vultr VM alegând orice tip de server , locație și dimensiunea serverului ales. Pentru alegerea Sistemului de operare , asigurați-vă că selectați Ubuntu 14.04 x64 și verificați opțiunea Enable Private Network . De asemenea, ASIGURĂ-TE pentru a selecta scriptul de pornire creat mai sus înainte de a plasa comanda.
După ce noua dvs. instanță virtuală este gata, conectați-vă la un terminal / prompt de comandă prin SSH.
ssh root@[vultr-ip-address]
Când vi se solicită parola, utilizați parola inițială sub fila „Informații despre server” de la Vultr admin.
Puteți actualiza parola tastând passwd
și apăsând tasta ENTER . Ubuntu vă va solicita o nouă parolă (în acest fel puteți alege ceva ce vă amintiți cu ușurință).
Porniți RethinkDB rulând comanda de mai jos. Rețineți că suntem „obligați la toate”, astfel încât să nu ne confruntăm cu probleme atunci când încercăm să accesăm interfața de administrare web a RethinkDB.
rethinkdb --bind all
Odată ce RethinkDB este pornit, îl accesați fie prin linia de comandă, fie prin interfața web.
Pentru a accesa prin web, utilizați portul 8080 tastând http://[vultr-ip-address]:8080
bara de adrese a browserului dvs. web. Ar trebui să vedeți instrumentul minunat de administrare web al RethinkDB.
Pentru a accesa prin linia de comandă, începeți o nouă sesiune de terminal / comandă și conectați-vă la server prin SSH, așa cum s-a explicat anterior. Apoi, emite comanda rethinkdb admin join 127.0.0.1:29015
. Asigurați-vă că utilizați portul 29015 .
Vom folosi interfața web care merge mai departe pentru a manipula baza de date. Accesați-l accesând http://[vultr-ip-address]:8080
și faceți clic pe linkul „Tabele”. Veți vedea că RethinkDB a instalat deja o bază de date „test”. Faceți clic pe linkul „Data Explorer” și executați sub comanda pentru a șterge baza de date „test”.
r.dbDrop('test')
În timp ce este încă în secțiunea „Data Explorer” din administratorul RethinkDB, creați o nouă bază de date numită „tweetDB” rulând codul de mai jos.
r.dbCreate('tweetDB')
Apoi, creați un tabel „tweet-uri”.
r.db('tweetDB').tableCreate('tweets')
Inserați câteva înregistrări în tabelul „tweet-urilor”.
r.db('tweetDB').table('tweets').insert([
{
name: 'Lami',
twitterHandle: 'mrLami',
message: 'Best cloud hosting on the planet - vultr'
},
{
name: 'Vultr Hosting',
twitterHandle: '@TheVultr',
message: '50% off on new instances - coupon - tgif'
}
])
Întrebarea tabelului „tweet-uri” pentru a vedea rezultatele.
r.db('tweetDB').table('tweets')
Ar trebui să vedeți următoarele în vizualizarea arborelui (cu diferite ID-uri).
[
{
"id": "6afe436c-7db4-4c86-b4db-3279acb3265d" ,
"message": "50% off on new instances - coupon - tgif" ,
"name": "Vultr Hosting" ,
"twitterHandle": "@TheVultr"
} ,
{
"id": "fd328cd5-d9f4-40ee-8a32-880cd8cda15d" ,
"message": "Best cloud hosting on the planet - vultr" ,
"name": "Lami" ,
"twitterHandle": "mrLami"
}
]
Rotiți o a doua și a treia mașină utilizând instrucțiuni din secțiunile „Instalare” , „Conectați-vă la noua dvs. instanță virtuală” și „Accesarea bazei de date” din acest ghid. Asigurați-vă că ștergeți baza de date „test” pe fiecare dintre noile instanțe și NU adăugați nicio bază de date nouă la acestea.
După ștergerea bazei de date „test” din a doua și a treia instanță, reveniți la indicațiile de comandă ale acestora și opriți RethinkDB emitând Ctrl + C (sau Cmd + C pe Mac). Acum începeți din nou RethinkDB pe aceste instanțe folosind comanda de mai jos (practic spunem noi a doua și a treia instanțe să se alăture primei).
$ rethinkdb --join [ip-of-first-vultr-vm]:29015 --bind all
În a doua și a treia instanță, accesați interfețele de administrare web și accesați secțiunea „Explorator de date”. Rulați următoarea interogare pentru a obține o listă de tweet-uri.
r.db('tweetDB').table('tweets')
Veți vedea că s-au reprodus deja din instanța master (prima configurație VM).
Deși RethinkDB se află încă la începutul acestei scrieri, are o mulțime de promisiuni și are o interfață puternică de administrare bazată pe web, care face sarcini dificile implicate de obicei cu scalarea unei baze de date (clarificare, replicare) ușor de realizat cu doar câteva clicuri.
Pentru mai multe lecturi, accesați documentele RethinkDB . De asemenea, consultați canalul IRC #rethinkdb pentru a afla mai multe din comunitate.
Scris de Lami Adabonyan
O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
Mulți dintre voi cunoașteți Switch care va fi lansat în martie 2017 și noile sale funcții. Pentru cei care nu știu, am pregătit o listă de funcții care fac din „Switch” un „gadget obligatoriu”.
Aștepți ca giganții tehnologiei să-și îndeplinească promisiunile? vezi ce a ramas nelivrat.
Citiți blogul pentru a cunoaște diferitele straturi din Arhitectura Big Data și funcționalitățile acestora în cel mai simplu mod.
Citiți asta pentru a afla cum devine populară inteligența artificială în rândul companiilor la scară mică și cum crește probabilitățile de a le face să crească și de a le oferi concurenților avantaje.
CAPTCHA a devenit destul de dificil de rezolvat pentru utilizatori în ultimii ani. Va fi capabil să rămână eficient în detectarea spam-ului și a botului în viitor?
Pe măsură ce Știința Evoluează într-un ritm rapid, preluând multe dintre eforturile noastre, crește și riscurile de a ne supune unei Singularități inexplicabile. Citiți, ce ar putea însemna singularitatea pentru noi.
Ce este telemedicina, îngrijirea medicală la distanță și impactul acesteia asupra generației viitoare? Este un loc bun sau nu în situația de pandemie? Citiți blogul pentru a găsi o vedere!
Poate ați auzit că hackerii câștigă mulți bani, dar v-ați întrebat vreodată cum câștigă acești bani? sa discutam.
Recent, Apple a lansat macOS Catalina 10.15.4 o actualizare suplimentară pentru a remedia problemele, dar se pare că actualizarea provoacă mai multe probleme care duc la blocarea mașinilor Mac. Citiți acest articol pentru a afla mai multe