Hadoop Ücretsiz Büyük Veri Aracı
Karmaşık veri setlerini büyük veri analizi yazılımı ile analiz edin
Ücretsiz ve açık kaynaklı büyük veri araçlarıyla karmaşık verilerin daha hızlı işlenmesi. Büyük hacim, çeşitli veri setleri ile ilgilenmek ve iş karar vermeyi geliştirin.
Genel Bakış
Hadoop ücretsiz ve açık kaynaklı bir büyük veri aracıdır. Sağlam, güvenilir ve ölçeklenebilir büyük veri analizi yazılımıdır. HDF’ler (yüksek dağıtılmış dosya sistemi), mapReduce ve iplik, Hadoop’un üç temel bileşenidir. HDFS, iki tür düğümden oluşan bir depolama katmanıdır: Namenodlar ve Datanodlar. Bir bloğun konumu hakkındaki meta veriler Namenode’da saklanır. Önceden belirlenmiş bir dönemde, Datanodes bloğu saklar ve blok raporları Namenode’a gönderir. MapReduce işleme katmanı iki aşamaya ayrılır: harita fazı ve azaltma fazı. Birkaç düğüm boyunca dağıtılan verilerin eşzamanlı olarak işlenmesi amaçlanmıştır. Hadoop Big Data’da iplik, iş planlama ve kaynak yönetimi katmanıdır. Hadoop, büyük verileri işlemek için en iyi büyük veri yazılımlarından biridir. Hadoop kümesi oldukça ölçeklenebilir, bu nedenle Hadoop çerçevesine yatay ve dikey ölçeklendirme sağlar. Arıza toleransını sağlamak için bir çoğaltma mekanizmasına dayanan bir hata tolerans fonksiyonuna sahiptir. Hadoop, işler iyi gitmese bile verilerin hala mevcut olmasını sağlar. Datanodlardan biri başarısız olursa, kullanıcı aynı verilerin bir kopyasına sahip diğer Datanodlardan verilere erişebilir. Hadoop, verilerin bir düğüm kümesi aracılığıyla işlenmesini sağlayan dağıtılmış bir veri depolama sistemidir. Sonuç olarak, Hadoop Framework Lightning-Fast işleme yeteneklerini verir.
Sistem gereksinimleri
Hadoop’u kurmak için aşağıdaki yazılımlara sahip olmanız gerekir:
- Java
- sudo ayrıcalıkları olan kullanıcı
Özellikler
Hadoop’un temel özellikleri aşağıdadır:
- Ücretsiz ve açık kaynak
- Daha hızlı veri işleme
- Dağıtılmış işlem
- Hata Toleransı
- Güvenilir ve ölçeklenebilir
- Kullanımı kolay ve uygun maliyetli
- Veri Yeri
- Verilerin yüksek kullanılabilirliği
Kurulum
Hadoop’u Ubuntu’ya yükleyin
İlk olarak, OpenSsh sunucusunu ve istemcisini yüklemek için aşağıdaki komutu çalıştırın.
sudo apt install openssh-server openssh-client -y
Hadoop’u indirmek için komutu yürüt.
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
Hadoop kurulumunu başlatmak için dosyaları çıkarın.
tar xzf hadoop-3.2.1.tar.gz