Hadoop Ingyenes nagy adat eszköz
Elemezze az összetett adatkészleteket a Big Data Analytics szoftverrel
A komplex adatok gyorsabb feldolgozása ingyenes és nyílt forráskódú Big Data eszközökkel. Foglalkozzon a hatalmas mennyiséggel, az adatkészletek sokféleségével és javítsa az üzleti döntéshozatalt.
Áttekintés
A Hadoop egy ingyenes és nyílt forráskódú nagy adatgyűjtő. Robusztus, megbízható és skálázható Big Data Analytics szoftver. A HDFS (magas elosztott fájlrendszer), a MapReduce és a fonal a Hadoop három kulcsfontosságú eleme. A HDFS egy olyan tárolóréteg, amely kétféle csomópontból áll: namenodák és datanódok. A blokk helyének metaadatait a Namenode tárolja. Egy előre meghatározott időszakban a Datanodes tárolja a blokkot, és blokk jelentéseket küld a Namenode -nak. A MapReduce feldolgozó réteg két fázisra oszlik: a MAP fázis és a csökkentési fázis. A több csomópontra elosztott adatok egyidejű feldolgozására szolgál. A Hadoop Big Data -ban a fonal a munkaköri és az erőforrás -kezelési réteg. A Hadoop az egyik legjobb nagy adatszoftver a nagy adatok feldolgozásához. A Hadoop Cluster nagyon méretezhető, tehát lehetővé teszi a Hadoop keretrendszer vízszintes és függőleges méretezését. Hibatolerancia funkcióval rendelkezik, amely a replikációs mechanizmusra támaszkodik a hibatolerancia biztosítása érdekében. A Hadoop biztosítja, hogy az adatok továbbra is rendelkezésre álljanak, még akkor is, ha a dolgok nem mennek jól. Ha az egyik datanód meghiúsul, a felhasználó hozzáférhet más adatadatokból, amelyek ugyanazon adatok másolatát tartalmazzák. A Hadoop egy elosztott adattároló rendszer, amely lehetővé teszi az adatok csomópontok csoportján keresztül történő feldolgozását. Ennek eredményeként ez biztosítja a Hadoop keretvilágú villámgyors feldolgozási képességeket.
Rendszerkövetelmények
A Hadoop telepítéséhez a következő szoftverekkel kell rendelkeznie:
- Java
- Felhasználó sudo kiváltságokkal
Jellemzők
Az alábbiakban bemutatjuk a Hadoop legfontosabb jellemzőit:
- Ingyenes és nyílt forráskódú
- Gyorsabb adatfeldolgozás
- Elosztott feldolgozás
- Hibatűrés
- Megbízható és méretezhető
- Könnyen használható és költséghatékony
- Adat helysége
- Az adatok magas rendelkezésre állása
telepítés
Telepítse a Hadoop -ot az Ubuntu -ra
Először futtassa az alábbi parancsot az OpenSsh Server és az ügyfél telepítéséhez.
sudo apt install openssh-server openssh-client -y
Végezze el a parancsot a Hadoop letöltéséhez.
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
A fájlok kibontása a Hadoop telepítés kezdeményezéséhez.
tar xzf hadoop-3.2.1.tar.gz