Apache Storm Gratis big data tool

Gratis big data analysetools voor het verwerken van gegevensstromen

Verwerk snel een grote hoeveelheid gegevens in een fouttolerante en horizontale schaalbare methode met behulp van big data-verwerkingstool en toegang tot realtime gegevensanalyses.

Overzicht

Apache Storm is een open source realtime tool voor gegevensverwerking. Het is een eenvoudige, gebruiksvriendelijke tool voor big data-verwerking die werkt met elke programmeertaal. Het kan worden opgenomen in zowel kleine als grote bedrijven. Het is zeer schaalbaar en kan de efficiëntie behouden, zelfs wanneer de belasting toeneemt, door bronnen op een lineaire manier toe te voegen. Apache Storm verwerkt gegevensstromen in realtime, terwijl Hadoop -gegevens in batches verwerkt. Bestaande wachtrij- en databasetechnologieën kunnen worden geïntegreerd met Apache Storm. Het garandeert gegevensverwerking, zelfs als een of meer van de gekoppelde knooppunten van het cluster falen of berichten verloren gaan. Apache Storm heeft vier componenten, waaronder Tuple, Stream, Spouts en Bolts. In Apache Storm is de tuple de primaire gegevensstructuur. Het ondersteunt alle gegevenstypen en heeft een lijst met geordende elementen. Stream is een ongeordende reeks tupels. Spouts is een bron van streams die wordt gebruikt om gegevens uit gegevensbronnen te lezen. De hoofdinterface voor het implementeren van tuiten is ISPout. Verder zijn er talloze interfaces beschikbaar, waaronder Irichspout, Baserichspout en Kafkaspout. Bouten zijn componenten van logische verwerking. Spouts sturen informatie naar het bouten- en boutenproces, wat resulteert in een nieuwe uitvoerstroom. De centrale interface voor het implementeren van bouten wordt “Ibolt” genoemd. Bovendien is Apache Storm de bekende hulpmiddelen voor Big Data Analytics. Als gevolg hiervan gebruiken veel grote bedrijven het zoals Twitter, Navisite, Wego, Yahoo en vele anderen. Deze realtime analysetool is ontwikkeld in Java -taal. De licentie voor deze realtime gegevensverwerkingstool is Apache 2.0.

Systeem vereisten

Om Apache Storm te installeren, moet u de volgende software hebben:

Java
Gebruiker met sudo -privileges

Functies

Hierna volgen de belangrijkste kenmerken van Apache Storm:

Gratis en open source
Real-time gegevensverwerking
Snel en betrouwbaar
Zeer schaalbaar en parallelliseerbaar
Fouttolerantie
Eenvoudige API
Gebruik met elke taal
gemakkelijk te gebruiken en te implementeren
integreren met wachtrij- en databasesystemen

Installatie

Apache Storm installeren op Ubuntu 18.04

Installeer Zookeeper Framework

Installeer eerst Zookeeper Framework op de server. Maak een map en navigeer erin.

$ mkdir ~/bigdata
$ cd ~/bigdata

Commando uitvoeren om Zookeeper Framework te downloaden.

$ wget https://downloads.apache.org/zookeeper/zookeeper-3.6.0/apache-zookeeper-3.6.0-bin.tar.gz

Pak de bestanden uit en wijzig de directory door onderstaande opdrachten uit te voeren.

$ tar xfvz apache-zookeeper-3.6.0-bin.tar.gz
$ cd apache-zookeeper-3.6.0-bin.tar.gz

Kopieer het voorbeeldconfiguratiebestand met de nieuwe naam.

$ cp conf/zoo_sample.cfg conf/zoo.cfg

Open Conf/Zoo.cfg -bestand en voeg de volgende code toe.

admin.enableServer=true
admin.serverPort=9990

Voer commando uit om Zookeeper te starten.

$ bin/zkServer.sh start

Apache Storm installeren

Voer de opdracht uit om Apache Storm te downloaden.

$ wget ftp://apache.uib.no/pub/apache/storm/apache-storm-2.1.0/apache-storm-2.1.0.tar.gz

Pak het TAR -bestand uit en wijzig de directory met onderstaande opdrachten.

$ tar -zxf apache-storm-2.1.0.tar.gz
$ cd apache-storm-2.1.0

Open Conf/Storm.yaml -bestand en voeg hieronder regels toe.

storm.zookeeper.servers:
 - "localhost"
nimbus.seeds: [ "localhost" ]

Voer de opdracht uit om de nimbus te starten.

$ bin/storm nimbus

Start de supervisor door onderstaande opdracht uit te voeren.

$ bin/storm supervisor

Start de gebruikersinterface.

$ bin/storm ui

Open uw browser en voer http: // localhost: 8080 in voor toegang tot de stormclusterinformatie en de lopende topologie.

Ontdekken

Mogelijk vindt u de volgende links relevant:

Top 5 open source big data tools in 2021