OpenRefine Atvirojo kodo „Big Data“ įrankis
Nemokamas didelis duomenų sprendimas, skirtas tvarkyti didelio masto sudėtingus duomenis
Galinga nemokama didžiųjų duomenų platforma, skirta tyrinėti, transformuoti ir suderinti didelio masto nepatogius duomenis. Išplėskite jį naudodamiesi žiniatinklio paslaugomis ir išoriniais duomenų rinkiniais.
Apžvalga
„OpenRefine“ (anksčiau „Google Refine“) yra atvirojo kodo didelių duomenų įrankis, skirtas dirbti su sudėtingais duomenų rinkiniais. Tai nemokama didelių duomenų platforma, skirta manipuliuoti duomenimis. Tai padeda vartotojams išvalyti sujauktus duomenis ir konvertuoti juos į kitą formatą. Be to, „OpenRefine“ leidžia išplėsti duomenų rinkinius su įvairiomis žiniatinklio paslaugomis. „OpenRefine“ turi API, kuri gali būti naudojama norint integruoti su trečiųjų šalių paslaugomis ir automatizuoti operacijas. Pratęsimai gali būti naudojami norint išplėsti šį „Big Data“ sprendimą. Vartotojai gali lengvai atsisiųsti ir įdiegti plėtinius, kad patobulintų programos funkcionalumą. „OpenRefine“, skirtos dirbti su duomenų rinkiniais, yra ištirti, pakeisti, pakeisti, suderinti, eksportuoti ir daug daugiau funkcijų. Komplektas leidžia vartotojams ieškoti stulpelio, kuriame nėra modelių, tendencijų ir duomenų kitimo. Išraiškos funkcija „OpenRefine“ leidžia vartotojams valyti ir pakeisti duomenis. „Wikidata“ yra nemokamas ir atviras žinių šaltinis, kurį gali skaityti ir redaguoti tiek žmonės, tiek mašinos. „OpenRefine“ turi funkciją, leidžiančią vartotojams gauti ir pridėti duomenis prie „Wikidata“. Jis turi patikimą įrankį, skirtą eksportuoti duomenis į įvairius formatus ir išorinius šaltinius. Vartotojai gali įkelti duomenis į „Google“ lapus ir pridėti juos prie „Wikidata“. Šis atvirojo kodo „Big Data“ įrankis yra prieinamas „Windows“, „Mac“ ir „Linux“ operacinėms sistemoms. Vartotojai gali rasti trečiųjų šalių bibliotekas įvairioms programavimo kalboms, tokioms kaip PHP, „Java“, „Python“, „Ruby“ ir daugelis kitų operacijų automatizavimui. „OpenRefine“ parašyta „Java“, o šio didelio sprendimo licencija yra BSD-3.
Sistemos reikalavimai
Norėdami įdiegti „OpenRefine“, turite turėti šias programines įrangas:
- „Java 8“
- „Apache Maven“
Funkcijos
Toliau pateikiamos pagrindinės „OpenRefine“ savybės:
- Nemokamas ir atviras kodas
- Duomenų valymas ir filtravimas
- Importuoti duomenis iš įvairių formatų
- Duomenų suderinimas ir atitikimas
- Pasirinktinė užklausų kalba su „Grel“ ir „Python“ palaikymu
- praturtinti duomenis per API
- Duomenų transformacija
- duomenų susiejimas
- Išplėstinės duomenų operacijos
diegimas
diegimas „Linux“
Paleiskite žemiau komandą, kad atsisiųstumėte „OpenRefine“.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Ištraukite atsisiųstą failą paleidę žemiau esančią komandą.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Pradėkite „OpenRefine“.
$ ./refine
Tada patobulins jūsų interneto naršyklėje. Jei jis neveikia automatiškai, įveskite http: // localhost: 3333, kad pasiektumėte jį.
diegimas „Mac“
Atsisiųskite „Mac“ rinkinį iš httpsopenRefineorgdownloadhtml. Atidarykite ir vilkite piktogramą į aplanką „Applications“. Dukart spustelėkite piktogramą ir „Refine“ bus atidaryta interneto naršyklėje.
Diegimas „Windows“
Atsisiųskite „Windows“ rinkinį iš httpsopenRefineorgdownloadhtml. Išpakuokite atsisiųstą failą ir dukart spustelėkite „Refine.bat“ failą. Tada patobulins jūsų interneto naršyklėje. Jei jis neveikia automatiškai, įveskite http: // localhost: 3333, kad pasiektumėte jį.