Nástroj pro zpracování dat v reálném-IME

Apache Storm Bezplatný nástroj Big Data

Zdarma nástroje pro analýzu velkých dat pro zpracování datových toků

Rychle zpracovávejte velké množství dat v metodě tolerantní a horizontální škálovatelné poruchy pomocí nástroje pro zpracování velkých dat a přístupu k analýze dat v reálném čase.

Přehled

Apache Storm je nástroj pro zpracování dat v reálném čase v reálném čase. Je to jednoduchý, uživatelsky přívětivý nástroj pro zpracování velkých dat, který pracuje s jakýmkoli programovacím jazykem. Může být začleněn do malých i velkých podniků. Je vysoce škálovatelný a může udržovat účinnost, i když se zatížení zvyšuje, přidáním zdrojů lineárním způsobem. Apache Storm zpracovává datové toky v reálném čase, zatímco Hadoop zpracovává data v dávkách. Existující technologie front a databáze lze integrovat do Apache Storm. Zaručuje zpracování dat, i když jeden nebo více z propojených uzlů klastru selže nebo se ztratí zprávy. Apache Storm má čtyři komponenty včetně n -tice, potoka, výtoků a šroubů. V Apache Storm je primární datová struktura. Podporuje všechny typy dat a má seznam uspořádaných prvků. Stream je neuspořádaná sekvence n -tic. Výkřiky jsou zdrojem proudů, které se používají ke čtení dat ze zdrojů dat. Hlavním rozhraním pro implementaci výtoků je ISPOUT. Dále je k dispozici řada rozhraní, včetně Irichspout, Barerichspout a KafKaspout. Šrouby jsou součástí logického zpracování. Výtoky posílají informace do procesu šroubů a šroubů, což má za následek nový výstupní proud. Centrální rozhraní pro implementaci šroubů se nazývá „ibolt“. Kromě toho je Apache Storm dobře známý nástroj Ree Big Data Analytics. Výsledkem je, že mnoho velkých korporací to používá jako Twitter, Navisite, Wego, Yahoo a mnoho dalších. Tento analytický nástroj v reálném čase je vyvíjen v jazyce Java. Licence pro tento nástroj pro zpracování dat v reálném čase je Apache 2.0.

Požadavky na systém

Chcete -li nainstalovat Storm Apache Storm, musíte mít následující software:

  • Java
  • Uživatel s oprávněními sudo

Funkce

Následující jsou klíčové rysy Apache Storm:

  • Zdarma a open source
  • Zpracování dat v reálném čase
  • Rychlé a spolehlivé
  • Vysoce škálovatelné a paralelizovatelné
  • Odolnost proti chybám
  • Jednoduché API
  • Používejte s jakýmkoli jazykem
  • Snadné použití a nasazení
  • Integrujte se do front a databázových systémů

Instalace

Nainstalujte Apache Storm na Ubuntu 18.04

Nainstalujte Zookeeper Framework

Nejprve nainstalujte na server rámec Zookeeper. Vytvořte adresář a najděte do něj.

$ mkdir ~/bigdata
$ cd ~/bigdata

Spusťte příkaz ke stažení framework Zookeeper.

$ wget https://downloads.apache.org/zookeeper/zookeeper-3.6.0/apache-zookeeper-3.6.0-bin.tar.gz

Extrahujte soubory a změňte adresář spuštěním pod příkazy.

$ tar xfvz apache-zookeeper-3.6.0-bin.tar.gz
$ cd apache-zookeeper-3.6.0-bin.tar.gz

Zkopírujte ukázkový konfigurační soubor s novým názvem.

$ cp conf/zoo_sample.cfg conf/zoo.cfg

Otevřete soubor Conf/Zoo.cfg a přidejte do něj následující kód.

admin.enableServer=true
admin.serverPort=9990

Spusťte příkaz a spusťte zookeeper.

$ bin/zkServer.sh start

Nainstalujte Storm Apache

Spusťte příkaz ke stažení Apache Storm.

$ wget ftp://apache.uib.no/pub/apache/storm/apache-storm-2.1.0/apache-storm-2.1.0.tar.gz

Extrahujte soubor TAR a změňte adresář pomocí příkazů níže.

$ tar -zxf apache-storm-2.1.0.tar.gz
$ cd apache-storm-2.1.0

Otevřete soubor Conf/Storm.YAML a přidejte do něj níže.

storm.zookeeper.servers:
 - "localhost"
nimbus.seeds: [ "localhost" ]

Spusťte příkaz a spusťte Nimbus.

$ bin/storm nimbus

Spusťte supervizora spuštěním pod příkazem.

$ bin/storm supervisor

Spusťte uživatelské rozhraní.

$ bin/storm ui

Otevřete prohlížeč a zadejte http: // localhost: 8080 a získejte přístup k informacím o Storm Cluster a jeho běžící topologii.

Prozkoumejte

Následující odkazy můžete považovat za relevantní:

 Čeština