Инструмент больших данных с открытым исходным кодом

Hadoop Бесплатный инструмент больших данных

Анализировать сложные наборы данных с помощью программного обеспечения для анализа больших данных

Более быстрая обработка сложных данных с помощью бесплатных и с открытым исходным кодом инструментов больших данных. Работайте с огромным объемом, разнообразием наборов данных и улучшают принятие бизнес -решений.

Обзор

Hadoop - это бесплатный инструмент больших данных с открытым исходным кодом. Это надежное, надежное и масштабируемое программное обеспечение для анализа больших данных. HDF (высоко распределенная файловая система), MapReduce и пряжа являются тремя ключевыми компонентами Hadoop. HDFS - это уровень хранения, который состоит из двух видов узлов: наменодов и данных. Метаданные о расположении блока хранятся в Наменоде. В заданный период Datanodes хранит блок и отправляет отчеты блоков в Namenode. Слой обработки MapReduce разделен на две фазы: фаза карты и фаза уменьшения. Он предназначен для одновременной обработки данных, которые распределены по нескольким узлам. В больших данных Hadoop пряжа - это планирование работы и уровень управления ресурсами. Hadoop - одно из лучших программных программных данных для обработки больших данных. Hadoop Cluster очень масштабируется, поэтому он позволяет горизонтально и вертикально масштабирование к структуре Hadoop. У него есть функция устойчивости к неисправности, которая опирается на механизм репликации, чтобы обеспечить устойчивость к разлому. Hadoop гарантирует, что данные все еще доступны, даже если дела идут не очень хорошо. Если один из данных DataNodes не удается, пользователь может получить доступ к данным из других данных, которые имеют копию одних и тех же данных. Hadoop - это распределенная система хранения данных, которая позволяет обрабатывать данные через кластер узлов. В результате это дает платформу Hadoop Framework Lightning-Fast-обработку.

Системные Требования

Чтобы установить Hadoop, вы должны иметь следующие программные материалы:

  • Джава
  • Пользователь с привилегиями SUDO

Функции

Ниже приведены ключевые особенности Hadoop:

  • Бесплатный и открытый исходный код
  • быстрая обработка данных
  • Распределенная обработка
  • Отказоустойчивость
  • надежный и масштабируемый
  • простой в использовании и экономически эффективном
  • Местность данных
  • Высокая доступность данных

Монтаж

Установить Hadoop на Ubuntu

Сначала запустите команду ниже, чтобы установить OpenSsh Server и Client.

sudo apt install openssh-server openssh-client -y

Выполнить команду, чтобы скачать Hadoop.

wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

Извлеките файлы, чтобы инициировать установку Hadoop.

tar xzf hadoop-3.2.1.tar.gz

Исследовать

Вы можете найти следующие ссылки актуальными:

 Русский