Hadoop Бесплатный инструмент больших данных
Анализировать сложные наборы данных с помощью программного обеспечения для анализа больших данных
Более быстрая обработка сложных данных с помощью бесплатных и с открытым исходным кодом инструментов больших данных. Работайте с огромным объемом, разнообразием наборов данных и улучшают принятие бизнес -решений.
Обзор
Hadoop - это бесплатный инструмент больших данных с открытым исходным кодом. Это надежное, надежное и масштабируемое программное обеспечение для анализа больших данных. HDF (высоко распределенная файловая система), MapReduce и пряжа являются тремя ключевыми компонентами Hadoop. HDFS - это уровень хранения, который состоит из двух видов узлов: наменодов и данных. Метаданные о расположении блока хранятся в Наменоде. В заданный период Datanodes хранит блок и отправляет отчеты блоков в Namenode. Слой обработки MapReduce разделен на две фазы: фаза карты и фаза уменьшения. Он предназначен для одновременной обработки данных, которые распределены по нескольким узлам. В больших данных Hadoop пряжа - это планирование работы и уровень управления ресурсами. Hadoop - одно из лучших программных программных данных для обработки больших данных. Hadoop Cluster очень масштабируется, поэтому он позволяет горизонтально и вертикально масштабирование к структуре Hadoop. У него есть функция устойчивости к неисправности, которая опирается на механизм репликации, чтобы обеспечить устойчивость к разлому. Hadoop гарантирует, что данные все еще доступны, даже если дела идут не очень хорошо. Если один из данных DataNodes не удается, пользователь может получить доступ к данным из других данных, которые имеют копию одних и тех же данных. Hadoop - это распределенная система хранения данных, которая позволяет обрабатывать данные через кластер узлов. В результате это дает платформу Hadoop Framework Lightning-Fast-обработку.
Системные Требования
Чтобы установить Hadoop, вы должны иметь следующие программные материалы:
- Джава
- Пользователь с привилегиями SUDO
Функции
Ниже приведены ключевые особенности Hadoop:
- Бесплатный и открытый исходный код
- быстрая обработка данных
- Распределенная обработка
- Отказоустойчивость
- надежный и масштабируемый
- простой в использовании и экономически эффективном
- Местность данных
- Высокая доступность данных
Монтаж
Установить Hadoop на Ubuntu
Сначала запустите команду ниже, чтобы установить OpenSsh Server и Client.
sudo apt install openssh-server openssh-client -y
Выполнить команду, чтобы скачать Hadoop.
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
Извлеките файлы, чтобы инициировать установку Hadoop.
tar xzf hadoop-3.2.1.tar.gz