오픈 소스 빅 데이터 도구

Hadoop 무료 빅 데이터 도구

빅 데이터 분석 소프트웨어로 복잡한 데이터 세트를 분석하십시오

무료 및 오픈 소스 빅 데이터 도구로 복잡한 데이터를 더 빠르게 처리합니다. 대량의 규모, 다양한 데이터 세트를 처리하고 비즈니스 의사 결정을 향상시킵니다.

개요

Hadoop은 무료 및 오픈 소스 빅 데이터 도구입니다. 강력하고 신뢰할 수 있으며 확장 가능한 빅 데이터 분석 소프트웨어입니다. HDFS (높은 분산 파일 시스템), MapReduce 및 원사는 Hadoop의 세 가지 주요 구성 요소입니다. HDFS는 두 종류의 노드 (나머노드와 Datanodes)로 구성된 저장 레이어입니다. 블록 위치에 대한 메타 데이터는 Namenode에 저장됩니다. 미리 정해진 기간에 DataNodes는 블록을 저장하고 블록 보고서를 나 메노드로 보냅니다. MapReduce 처리 층은 맵 단계와 감소 단계의 두 단계로 나뉩니다. 여러 노드에 배포되는 데이터의 동시 처리를위한 것입니다. Hadoop Big Data에서 Yarn은 작업 일정 및 자원 관리 계층입니다. Hadoop은 큰 데이터를 처리하기위한 최고의 빅 데이터 소프트웨어 중 하나입니다. Hadoop 클러스터는 확장 가능성이 높으므로 Hadoop 프레임 워크에 수평 및 수직 스케일링이 가능합니다. 결함 공차를 보장하기 위해 복제 메커니즘에 의존하는 결함 공차 기능이 있습니다. Hadoop은 상황이 제대로 진행되지 않더라도 데이터를 사용할 수 있도록합니다. DataNodes 중 하나가 실패하면 사용자는 동일한 데이터 사본이있는 다른 데이터 노드의 데이터에 액세스 할 수 있습니다. Hadoop은 분산 된 데이터 저장 시스템으로, 노드 클러스터를 통해 데이터를 처리 할 수 ​​있습니다. 결과적으로 Hadoop Framework의 번개 빠른 처리 기능을 제공합니다.

시스템 요구 사항

Hadoop을 설치하려면 다음과 같은 소프트웨어가 있어야합니다.

  • 자바
  • Sudo 권한이있는 사용자

특징

다음은 Hadoop의 주요 기능입니다.

  • 무료 및 오픈 소스
  • 더 빠른 데이터 처리
  • 분산 처리
  • 결함 허용
  • 신뢰할 수 있고 확장 가능
  • 사용하기 쉽고 비용 효율적입니다
  • 데이터 로컬
  • 데이터의 고 가용성

설치

Ubuntu에 Hadoop을 설치하십시오

먼저 아래 명령을 실행하여 OpenSsh 서버 및 클라이언트를 설치하십시오.

sudo apt install openssh-server openssh-client -y

Hadoop을 다운로드하려면 명령을 실행하십시오.

wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

Hadoop 설치를 시작하기 위해 파일을 추출하십시오.

tar xzf hadoop-3.2.1.tar.gz

탐구하다

다음 링크를 찾을 수 있습니다.

-2021 년 상위 5 개 오픈 소스 빅 데이터 도구

 한국인