OpenRefine Open Source Big Data Tool
Bezplatné řešení velkých dat pro manipulaci s rozsáhlými složitými daty
Výkonná bezplatná platforma Big Data pro zkoumání, transformaci a sladění rozsáhlých chaotických dat. Rozšiřte jej pomocí webových služeb a externích datových sad.
Přehled
OpenRefine (dříve Google Refine) je nástroj Big Data s otevřeným zdrojovým kódem pro práci se složitými datovými sadami. Je to bezplatná velká datová platforma pro manipulaci s daty. Pomáhá uživatelům vyčistit zmatená data a převést je do jiného formátu. OpenRefine dále umožňuje rozšíření datových sad s různými webovými službami. OpenRefine má API, které lze použít k integraci do služeb třetích stran a automatizaci operací. Prodloužení lze použít k rozšíření tohoto řešení Big Data. Uživatelé si mohou snadno stáhnout a nainstalovat rozšíření, aby se zlepšila funkčnost programu. Zkoumání, aspekty, transformace, sladění, export a mnoho dalších funkcí je k dispozici v OpenRefine pro práci s datovými sadami. FaceTing umožňuje uživatelům hledat sloupec pro vzory, trendy a variace dat. Funkce výrazu v OpenRefine umožňuje uživatelům vyčistit a transformovat data. Wikidata je bezplatný a otevřený zdroj znalostí, který lidé i stroje mohou číst a upravovat. OpenRefine má funkci, která umožňuje uživatelům načíst a přidat data do WikiData. Má robustní nástroj pro export dat do různých formátů a externích zdrojů. Uživatelé mohou nahrát data do listů Google a přidat je také do WikiData. Tento nástroj Big Data Open Source je k dispozici pro operační systémy Windows, Mac a Linux. Uživatelé mohou najít knihovny třetích stran pro různé programovací jazyky, jako jsou PHP, Java, Python, Ruby a mnoho dalších pro automatizaci operací. OpenRefine je psána v Javě a licence pro toto velké řešení je BSD-3.
Požadavky na systém
Chcete -li nainstalovat OpenRefine, musíte mít následující software:
- Java 8
- Apache Maven
Funkce
Následující jsou klíčové rysy OpenRefine:
- Zdarma a open source
- Čištění a filtrování dat
- Importovat data z různých formátů
- Srovnání a porovnávání dat
- Vlastní jazyk dotazů s podporou Grel a Python
- obohatit data prostřednictvím API
- Transformace dat
- Propojení dat
- Pokročilé datové operace
Instalace
Instalace na Linux
Spusťte pod příkazem a stáhněte si OpenRefine.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Vytáhněte stažený soubor spuštěním pod příkazem.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Začněte OpenRefine.
$ ./refine
Zpřesněte se poté otevřen ve vašem webovém prohlížeči. Pokud se spustí automaticky, zadejte http: // localhost: 3333 pro přístup k němu.
Instalace na Mac
Stáhněte si Kit Mac od httpsopenrefineorgdownloadHtml. Otevřete a přetáhněte ikonu do složky aplikací. V webovém prohlížeči se otevřete dvojité kliknutí na ikonu a upřesnění.
Instalace na Windows
Stáhněte si soupravu Windows od httpsopenrefineorgdownloadHtml. Rozbalte stažený soubor a poklepejte na soubor Refine.bat. Zpřesněte se poté otevřen ve vašem webovém prohlížeči. Pokud se spustí automaticky, zadejte http: // localhost: 3333 pro přístup k němu.