Изучение 26 методов анализа больших данных: часть 1
Изучение 26 методов анализа больших данных: часть 1
RethinkDB - это база данных NoSQL, которая хранит данные в виде документов JSON. Он обладает суперинтуитивным языком запросов и функциями, обычно доступными в традиционных СУБД, такими как «объединение таблиц» и «группировка по». В этом руководстве объясняется, как настроить кластер RethinkDB, используя 3 Vultr VPS-сервера под управлением Ubuntu 14.04.
Создайте новый сценарий запуска Vultr, используя в качестве шаблона следующее содержимое.
#!/usr/bin/env bash
echo ">>> Installing RethinkDB<<<"
# Add RethinkDB Repo to list of Repos
source /etc/lsb-release && echo "deb http://download.rethinkdb.com/apt $DISTRIB_CODENAME main" | sudo tee /etc/apt/sources.list.d/rethinkdb.list
wget -qO- http://download.rethinkdb.com/apt/pubkey.gpg | sudo apt-key add -
# Update Apt Repo & Install RethinkDB
sudo apt-get update
sudo apt-get install -qq rethinkdb
Раскрутите экземпляр виртуальной машины Vultr, выбрав любой тип сервера , расположение и размер сервера по вашему выбору. Для выбора операционной системы обязательно выберите Ubuntu 14.04 x64 и установите флажок « Включить частную сеть» . Также ОБЯЗАТЕЛЬНО выберите сценарий запуска, созданный выше, перед оформлением заказа.
Когда ваш новый экземпляр VM будет готов, подключитесь к нему из терминала / командной строки через SSH.
ssh root@[vultr-ip-address]
При запросе пароля введите начальный пароль на вкладке «Информация о сервере» от администратора Vultr.
Вы можете обновить свой пароль, набрав passwd
и нажав клавишу ВВОД . Ubuntu попросит вас ввести новый пароль (таким образом, вы сможете выбрать то, что вы легко запомните).
Запустите RethinkDB, выполнив команду ниже. Обратите внимание, что мы «привязаны ко всем», чтобы не сталкиваться с проблемами при попытке получить доступ к интерфейсу веб-администратора RethinkDB.
rethinkdb --bind all
Как только RethinkDB запущен, вы получаете к нему доступ из командной строки или через веб-интерфейс.
Чтобы получить доступ через Интернет, используйте порт 8080 , набрав http://[vultr-ip-address]:8080
в адресной строке веб-браузера. Вы должны увидеть удивительный инструмент веб-администрирования RethinkDB.
Для доступа через командную строку запустите новый сеанс терминала / командной строки и подключитесь к серверу через SSH, как описано ранее. Затем выполните команду rethinkdb admin join 127.0.0.1:29015
. Убедитесь, что вы используете порт 29015 .
Мы будем использовать веб-интерфейс для управления базой данных. Чтобы получить к нему доступ, http://[vultr-ip-address]:8080
перейдите по ссылке и нажмите ссылку «Таблицы». Вы увидите, что RethinkDB уже установил «тестовую» базу данных. Нажмите на ссылку «Проводник данных» и выполните команду ниже, чтобы удалить «тестовую» базу данных.
r.dbDrop('test')
Оставаясь в разделе «Проводник данных» администратора RethinkDB, создайте новую базу данных с именем «tweetDB», запустив приведенный ниже код.
r.dbCreate('tweetDB')
Затем создайте таблицу «твитов».
r.db('tweetDB').tableCreate('tweets')
Вставьте некоторые записи в таблицу «твиты».
r.db('tweetDB').table('tweets').insert([
{
name: 'Lami',
twitterHandle: 'mrLami',
message: 'Best cloud hosting on the planet - vultr'
},
{
name: 'Vultr Hosting',
twitterHandle: '@TheVultr',
message: '50% off on new instances - coupon - tgif'
}
])
Запросите таблицу «твиты», чтобы увидеть результаты.
r.db('tweetDB').table('tweets')
Вы должны увидеть следующее под деревом (с разными идентификаторами).
[
{
"id": "6afe436c-7db4-4c86-b4db-3279acb3265d" ,
"message": "50% off on new instances - coupon - tgif" ,
"name": "Vultr Hosting" ,
"twitterHandle": "@TheVultr"
} ,
{
"id": "fd328cd5-d9f4-40ee-8a32-880cd8cda15d" ,
"message": "Best cloud hosting on the planet - vultr" ,
"name": "Lami" ,
"twitterHandle": "mrLami"
}
]
Раскрутите вторую и третью машину, используя инструкции из разделов «Установка» , «Подключение к новой виртуальной машине» и «Доступ к базе данных» данного руководства. Обязательно удалите «тестовую» базу данных на каждом из новых экземпляров и НЕ добавляйте в них новые базы данных.
После удаления «тестовой» базы данных из второго и третьего экземпляров вернитесь к их командным приглашениям и остановите RethinkDB, введя Ctrl + C (или Cmd + C на Mac). Теперь снова запустите RethinkDB для этих экземпляров, используя команду ниже (мы в основном говорим новым вторым и третьим экземплярам присоединиться к первому).
$ rethinkdb --join [ip-of-first-vultr-vm]:29015 --bind all
Во втором и третьем экземплярах получите доступ к интерфейсам веб-администратора и перейдите в раздел «Проводник данных». Запустите следующий запрос, чтобы получить список твитов.
r.db('tweetDB').table('tweets')
Вы увидите, что они уже реплицированы из основного экземпляра (настройка первой виртуальной машины).
Хотя на момент написания этой статьи RethinkDB все еще находился в зачаточном состоянии, он имеет многообещающие перспективы и обладает мощным веб-интерфейсом администрирования, который позволяет легко выполнять сложные задачи, обычно связанные с масштабированием базы данных (сегментирование, репликация), всего несколькими щелчки.
Для дальнейшего чтения, посетите RethinkDB Docs . Также проверьте канал IRC #rethinkdb, чтобы узнать больше от сообщества.
Автор Лами Адабонян
Изучение 26 методов анализа больших данных: часть 1
Многие из вас знают Switch, который выйдет в марте 2017 года, и его новые функции. Для тех, кто не знает, мы подготовили список функций, которые делают «Switch» обязательным гаджетом.
Вы ждете, когда технологические гиганты выполнят свои обещания? проверить, что осталось недоставленным.
Прочтите блог, чтобы узнать о различных уровнях архитектуры больших данных и их функциях самым простым способом.
Прочтите это, чтобы узнать, как искусственный интеллект становится популярным среди небольших компаний и как он увеличивает вероятность их роста и дает преимущество перед конкурентами.
CAPTCHA стало довольно сложно решать пользователям за последние несколько лет. Сможет ли он оставаться эффективным в обнаружении спама и ботов в ближайшем будущем?
По мере того, как наука развивается быстрыми темпами, принимая на себя большую часть наших усилий, также возрастает риск подвергнуться необъяснимой сингулярности. Прочтите, что может значить для нас необычность.
Что такое телемедицина, дистанционное здравоохранение и их влияние на будущее поколение? Это хорошее место или нет в ситуации пандемии? Прочтите блог, чтобы узнать мнение!
Возможно, вы слышали, что хакеры зарабатывают много денег, но задумывались ли вы когда-нибудь о том, как они зарабатывают такие деньги? Давайте обсудим.
Недавно Apple выпустила macOS Catalina 10.15.4, дополнительное обновление для исправления проблем, но похоже, что это обновление вызывает больше проблем, приводящих к поломке компьютеров Mac. Прочтите эту статью, чтобы узнать больше