Hadoop Gratis big data -verktyg

Analysera komplexa datauppsättningar med Big Data Analytics -programvara

Snabbare bearbetning av komplexa data med gratis och open source big data -verktyg. Hantera massiv volym, olika datamängder och förbättra affärsbeslut.

Översikt

Hadoop är ett gratis och öppen källkod Big Data -verktyg. Det är robust, pålitlig och skalbar Big Data Analytics -programvara. HDFS (högt distribuerat filsystem), MapReduce och garn är de tre viktigaste komponenterna i Hadoop. HDFS är ett lagringslager som består av två slags noder: namenoder och datanoder. Metadata om ett blocks plats lagras i namenode. Under en förutbestämd period lagrar Datanodes blocket och skickar blockrapporter till NameNode. MapReduce -bearbetningsskiktet är uppdelat i två faser: kartfasen och reduceringsfasen. Det är avsett för samtidig bearbetning av data som är distribuerade över flera noder. I Hadoop Big Data är garn arbetsplanering och resurshanteringslager. Hadoop är en av de bästa big data -programvaran för att bearbeta stora data. Hadoop -kluster är mycket skalbart, så det tillåter horisontell och vertikal skalning till Hadoop -ramverket. Den har en feltoleransfunktion som förlitar sig på en replikationsmekanism för att säkerställa feltolerans. Hadoop säkerställer att data fortfarande är tillgängliga, även om det inte går bra. Om en av datanoderna misslyckas kan användaren komma åt data från andra datanoder som har en kopia av samma data. Hadoop är ett distribuerat datalagringssystem som gör det möjligt att behandla data genom ett kluster av noder. Som ett resultat ger det Hadoop Framework-snabba bearbetningsfunktioner.

Systemkrav

För att installera Hadoop måste du ha följande programvara:

Java
Användare med sudo -privilegier

Funktioner

Följande är de viktigaste funktionerna i Hadoop:

Gratis och öppen källkod
Snabbare databehandling
Distribuerad behandling
Feltolerans
Pålitlig och skalbar
Lätt att använda och kostnadseffektivt
Datalokalitet
Hög tillgänglighet av data

Installation

Install Hadoop på Ubuntu

Kör först under kommandot för att installera OpenSSH -server och klient.

sudo apt install openssh-server openssh-client -y

Kör kommandot för att ladda ner Hadoop.

wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

Extrahera filerna för att initiera Hadoop -installationen.

tar xzf hadoop-3.2.1.tar.gz

Utforska

Du kan hitta följande länkar relevanta:

Topp 5 Open Source Big Data Tools 2021