Hadoop Gratis big data -verktyg
Analysera komplexa datauppsättningar med Big Data Analytics -programvara
Snabbare bearbetning av komplexa data med gratis och open source big data -verktyg. Hantera massiv volym, olika datamängder och förbättra affärsbeslut.
Översikt
Hadoop är ett gratis och öppen källkod Big Data -verktyg. Det är robust, pålitlig och skalbar Big Data Analytics -programvara. HDFS (högt distribuerat filsystem), MapReduce och garn är de tre viktigaste komponenterna i Hadoop. HDFS är ett lagringslager som består av två slags noder: namenoder och datanoder. Metadata om ett blocks plats lagras i namenode. Under en förutbestämd period lagrar Datanodes blocket och skickar blockrapporter till NameNode. MapReduce -bearbetningsskiktet är uppdelat i två faser: kartfasen och reduceringsfasen. Det är avsett för samtidig bearbetning av data som är distribuerade över flera noder. I Hadoop Big Data är garn arbetsplanering och resurshanteringslager. Hadoop är en av de bästa big data -programvaran för att bearbeta stora data. Hadoop -kluster är mycket skalbart, så det tillåter horisontell och vertikal skalning till Hadoop -ramverket. Den har en feltoleransfunktion som förlitar sig på en replikationsmekanism för att säkerställa feltolerans. Hadoop säkerställer att data fortfarande är tillgängliga, även om det inte går bra. Om en av datanoderna misslyckas kan användaren komma åt data från andra datanoder som har en kopia av samma data. Hadoop är ett distribuerat datalagringssystem som gör det möjligt att behandla data genom ett kluster av noder. Som ett resultat ger det Hadoop Framework-snabba bearbetningsfunktioner.
Systemkrav
För att installera Hadoop måste du ha följande programvara:
- Java
- Användare med sudo -privilegier
Funktioner
Följande är de viktigaste funktionerna i Hadoop:
- Gratis och öppen källkod
- Snabbare databehandling
- Distribuerad behandling
- Feltolerans
- Pålitlig och skalbar
- Lätt att använda och kostnadseffektivt
- Datalokalitet
- Hög tillgänglighet av data
Installation
Install Hadoop på Ubuntu
Kör först under kommandot för att installera OpenSSH -server och klient.
sudo apt install openssh-server openssh-client -y
Kör kommandot för att ladda ner Hadoop.
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
Extrahera filerna för att initiera Hadoop -installationen.
tar xzf hadoop-3.2.1.tar.gz