Инструмент обработки данных в реальном времени

Apache Storm Бесплатный инструмент больших данных

Бесплатные инструменты анализа больших данных для обработки потоков данных

Быстро обработайте большой объем данных в сдержанном и горизонтальном масштабируемом методе, используя инструмент обработки больших данных и доступ к аналитике данных в реальном времени.

Обзор

Apache Storm-это инструмент обработки данных в реальном времени с открытым исходным кодом. Это простой, удобный для пользователя инструмент обработки больших данных, который работает с любым языком программирования. Это может быть включено как в малых, так и в крупных предприятиях. Он очень масштабируется и может поддерживать эффективность, даже когда нагрузка увеличивается, добавляя ресурсы линейным образом. Apache Storm обрабатывает потоки данных в режиме реального времени, в то время как Hadoop обрабатывает данные в партиях. Существующие технологии очереди и базы данных могут быть интегрированы с Apache Storm. Он гарантирует обработку данных, даже если один или несколько из связанных узлов кластера не сбои, или сообщения теряются. Apache Storm имеет четыре компонента, включая кортеж, ручей, носики и болты. В Apache Storm кортеж является основной структурой данных. Он поддерживает все типы данных и имеет список упорядоченных элементов. Поток - это неупорядоченная последовательность кортежей. Spouts является источником потоков, который используется для чтения данных из источников данных. Основным интерфейсом для реализации Spouts является ispout. Кроме того, есть многочисленные интерфейсы, в том числе Irichspout, Baserichspout и Kafkaspout. Болты являются компонентами логической обработки. Словы отправляют информацию в процесс болтов и болтов, что приводит к новому выходному потоку. Центральный интерфейс для реализации болтов называется «иболтом». Кроме того, Apache Storm является известным инструментом Analytics REE Big Data. В результате многие крупные корпорации используют его, такие как Twitter, Navisite, Wego, Yahoo и многие другие. Этот аналитический инструмент в реальном времени разработан на Java Language. Лицензия на этот инструмент обработки данных в реальном времени - Apache 2.0.

Системные Требования

Чтобы установить Apache Storm, вы должны иметь следующие программные материалы:

  • Джава
  • Пользователь с привилегиями SUDO

Функции

Ниже приведены ключевые особенности Apache Storm:

  • Бесплатный и открытый исходный код
  • Обработка данных в реальном времени
  • Быстрый и надежный
  • высоко масштабируемые и параллелизируемые
  • Отказоустойчивость
  • простой API
  • Использовать с любым языком
  • простой в использовании и развертывании
  • Интеграция с системами очередей и баз данных

Монтаж

Установите Apache Storm на Ubuntu 18.04

Установите Zookeeper Framework

Во -первых, установите Zookeeper Framework на сервер. Создайте каталог и перейдите в него.

$ mkdir ~/bigdata
$ cd ~/bigdata

Выполнить команду, чтобы загрузить Zookeeper Framework.

$ wget https://downloads.apache.org/zookeeper/zookeeper-3.6.0/apache-zookeeper-3.6.0-bin.tar.gz

Извлеките файлы и измените каталог, выполняя команды ниже.

$ tar xfvz apache-zookeeper-3.6.0-bin.tar.gz
$ cd apache-zookeeper-3.6.0-bin.tar.gz

Скопируйте пример файла конфигурации с новым именем.

$ cp conf/zoo_sample.cfg conf/zoo.cfg

Откройте файл conf/Zoo.cfg и добавьте в него следующий код.

admin.enableServer=true
admin.serverPort=9990

Запустите команду, чтобы начать Zookeeper.

$ bin/zkServer.sh start

Установить Apache Storm

Выполнить команду для загрузки Apache Storm.

$ wget ftp://apache.uib.no/pub/apache/storm/apache-storm-2.1.0/apache-storm-2.1.0.tar.gz

Извлеките файл TAR и измените каталог, используя команды ниже.

$ tar -zxf apache-storm-2.1.0.tar.gz
$ cd apache-storm-2.1.0

Откройте файл conf/storm.yaml и добавьте в него линии ниже.

storm.zookeeper.servers:
 - "localhost"
nimbus.seeds: [ "localhost" ]

Запустите команду, чтобы запустить Nimbus.

$ bin/storm nimbus

Начните руководителя, работая ниже команды.

$ bin/storm supervisor

Начните пользовательский интерфейс.

$ bin/storm ui

Откройте свой браузер и введите http: // localhost: 8080, чтобы получить доступ к информации о штормовом кластере и его запущенной топологии.

Исследовать

Вы можете найти следующие ссылки актуальными:

 Русский