Hadoop Bezplatný nástroj Big Data
Analyzujte složité soubory dat pomocí softwaru Big Data Analytics
Rychlejší zpracování složitých dat s volnými a open sourcemi velkými datovými nástroji. Řešit obrovský objem, rozmanitost datových souborů a zlepšení obchodního rozhodování.
Přehled
Hadoop je bezplatný a otevřený zdrojový nástroj Big Data. Je robustní, spolehlivý a škálovatelný software pro analýzu velkých dat. HDFS (vysoko distribuovaný systém souborů), MapReduce a příze jsou tři klíčové komponenty Hadoop. HDFS je úložná vrstva, která se skládá ze dvou druhů uzlů: Namenodes a Datanodes. Metadata o umístění bloku jsou uložena v Namenode. V předem stanoveném období DataNodes uloží blok a odesílá zprávy o blocích do NameNode. Vrstva zpracování MapReduce je rozdělena do dvou fází: fáze mapy a fáze redukce. Je určen pro souběžné zpracování dat, které je distribuováno v několika uzlech. V Hadoop Big Data je YARN plánování úloh a vrstva správy zdrojů. Hadoop je jedním z nejlepších velkých datových softwaru pro zpracování velkých dat. HADOOP Cluster je vysoce škálovatelný, takže umožňuje horizontální a vertikální škálování na rámec Hadoop. Má funkci tolerance poruch, která se spoléhá na replikační mechanismus, aby byla zajištěna tolerance poruch. Hadoop zajišťuje, že data jsou stále k dispozici, i když se věci nedaří dobře. Pokud jeden z DataNodes selže, může uživatel přistupovat k datům z jiných Datanodů, které mají kopii stejných dat. Hadoop je distribuovaný systém ukládání dat, který umožňuje zpracování dat prostřednictvím shluku uzlů. Výsledkem je, že poskytuje rámec Hadoop Lightning-rychlé zpracování.
Požadavky na systém
Chcete -li nainstalovat Hadoop, musíte mít následující software:
- Java
- Uživatel s oprávněními sudo
Funkce
Následující jsou klíčové rysy Hadoopu:
- Zdarma a open source
- rychlejší zpracování dat
- Distribuované zpracování
- Odolnost proti chybám
- Spolehlivé a škálovatelné
- Snadno použitelné a nákladově efektivní
- Datová lokalita
- Vysoká dostupnost dat
Instalace
Nainstalujte hadoop na ubuntu
Nejprve spusťte pod příkazem nainstalovat server OpenSSH a klienta.
sudo apt install openssh-server openssh-client -y
Spusťte příkaz ke stažení Hadoop.
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
Extrahujte soubory pro zahájení instalace Hadoop.
tar xzf hadoop-3.2.1.tar.gz