Hadoop नि: शुल्क डेटा उपकरण
बड़े डेटा एनालिटिक्स सॉफ्टवेयर के साथ जटिल डेटा सेट का विश्लेषण करें
मुफ्त और खुले स्रोत बड़े डेटा टूल के साथ जटिल डेटा का तेजी से प्रसंस्करण। बड़े पैमाने पर मात्रा, विभिन्न प्रकार के डेटा सेट से निपटें और व्यावसायिक निर्णय लेने में सुधार करें।
अवलोकन
Hadoop एक स्वतंत्र और ओपन सोर्स बिग डेटा टूल है। यह मजबूत, विश्वसनीय और स्केलेबल बिग डेटा एनालिटिक्स सॉफ्टवेयर है। HDFS (उच्च वितरित फ़ाइल सिस्टम), MapReduce, और यार्न Hadoop के तीन प्रमुख घटक हैं। HDFS एक स्टोरेज लेयर है जो दो प्रकार के नोड्स से बना होता है: Namenodes और Datanodes। एक ब्लॉक के स्थान के बारे में मेटाडेटा नामेनोड में संग्रहीत है। एक पूर्व निर्धारित अवधि में, Datanodes ब्लॉक को संग्रहीत करता है और Namenode को ब्लॉक रिपोर्ट भेजता है। MapReduce प्रसंस्करण परत को दो चरणों में विभाजित किया गया है: मानचित्र चरण और कम चरण। यह डेटा के समवर्ती प्रसंस्करण के लिए है जो कई नोड्स में वितरित किया जाता है। Hadoop Big Data में, यार्न नौकरी शेड्यूलिंग और संसाधन प्रबंधन परत है। Hadoop बड़े डेटा को संसाधित करने के लिए सबसे अच्छे बड़े डेटा सॉफ़्टवेयर में से एक है। Hadoop क्लस्टर अत्यधिक स्केलेबल है, इसलिए यह Hadoop ढांचे के लिए क्षैतिज और ऊर्ध्वाधर स्केलिंग की अनुमति देता है। इसमें एक गलती सहिष्णुता फ़ंक्शन है जो गलती सहिष्णुता सुनिश्चित करने के लिए एक प्रतिकृति तंत्र पर निर्भर करता है। Hadoop यह सुनिश्चित करता है कि डेटा अभी भी उपलब्ध है, तब भी जब चीजें ठीक नहीं होती हैं। यदि Datanodes में से एक विफल हो जाता है, तो उपयोगकर्ता अन्य Datanodes से डेटा तक पहुंच सकता है जिसमें एक ही डेटा की एक प्रति होती है। Hadoop एक वितरित डेटा स्टोरेज सिस्टम है जो डेटा को नोड्स के क्लस्टर के माध्यम से संसाधित करने में सक्षम बनाता है। नतीजतन, यह Hadoop फ्रेमवर्क लाइटनिंग-फास्ट प्रोसेसिंग क्षमताओं को देता है।
सिस्टम आवश्यकताएं
Hadoop को स्थापित करने के लिए, आपके पास निम्नलिखित सॉफ्टवेयर्स होने चाहिए:
- जावा
- SUDO विशेषाधिकारों के साथ उपयोगकर्ता
विशेषताएँ
Hadoop की प्रमुख विशेषताएं निम्नलिखित हैं:
- मुक्त और खुला स्रोत
- तेजी से डेटा प्रसंस्करण
- वितरित प्रसंस्करण
- दोष सहिष्णुता
- विश्वसनीय और स्केलेबल
- उपयोग करने में आसान और लागत प्रभावी
- डेटा स्थानीयता
- डेटा की उच्च उपलब्धता
स्थापना
Ubuntu पर Hadoop स्थापित करें
सबसे पहले, OpenSSH सर्वर और क्लाइंट स्थापित करने के लिए कमांड के नीचे चलाएं।
sudo apt install openssh-server openssh-client -y
Hadoop डाउनलोड करने के लिए कमांड निष्पादित करें।
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
Hadoop स्थापना शुरू करने के लिए फ़ाइलों को निकालें।
tar xzf hadoop-3.2.1.tar.gz