OpenRefine Open source big data tool
Gratis big data -oplossing voor het verwerken van grootschalige complexe gegevens
Krachtig gratis big data-platform voor het verkennen, transformeren en verzoenen van grootschalige rommelige gegevens. Breid het uit met webservices en externe gegevenssets.
Overzicht
OpenRefine (eerder Google Refine) is een open source big data -tool voor het werken met complexe datasets. Het is een gratis big data -platform voor het manipuleren van gegevens. Het helpt gebruikers om verknipte gegevens op te ruimen en om te converteren naar een ander formaat. Verder maakt OpenRefine het uit te breiden van datasets met verschillende webservices. OpenRefine heeft een API die kan worden gebruikt om te integreren met services van derden en bewerkingen te automatiseren. De extensies kunnen worden gebruikt om deze big data -oplossing uit te breiden. Gebruikers kunnen extensies eenvoudig downloaden en installeren om de functionaliteit van het programma te verbeteren. Onderzoek, facetten, transformeren, verzoenen, exporteren en nog veel meer functies zijn beschikbaar in OpenRefine voor het werken met datasets. Met faceting kunnen gebruikers een kolom zoeken naar patronen, trends en gegevensvariatie. Met de expressiefunctie in OpenRefine kunnen gebruikers gegevens reinigen en transformeren. Wikidata is een vrije en open kennisbron die zowel mensen als machines kunnen lezen en bewerken. OpenRefine heeft een functie waarmee gebruikers gegevens kunnen ophalen en toevoegen aan Wikidata. Het heeft een robuust hulpmiddel voor het exporteren van gegevens naar verschillende formaten en externe bronnen. Gebruikers kunnen gegevens uploaden naar Google Sheets en deze ook aan Wikidata toevoegen. Deze open source big data -tool is beschikbaar voor Windows-, Mac- en Linux -besturingssystemen. Gebruikers kunnen bibliotheken van derden vinden voor verschillende programmeertalen zoals PHP, Java, Python, Ruby en nog veel meer voor het automatiseren van de bewerkingen. OpenRefine is geschreven in Java en de licentie voor deze grote oplossing is BSD-3.
Systeem vereisten
Om OpenRefine te installeren, moet u de volgende software hebben:
- Java 8
- Apache Maven
Functies
Hierna volgen de belangrijkste kenmerken van OpenRefine:
- Gratis en open source
- Gegevensreiniging en filteren
- Importeer gegevens uit verschillende formaten
- Gegevensafstemming en matching
- Aangepaste vraagtaal met GREL- en PYTHON -ondersteuning
- Verrijk gegevens via API’s
- Transformatie van gegevens
- Gegevens koppelen
- Geavanceerde gegevensbewerkingen
Installatie
Installeren op Linux
Voer de onderstaande opdracht uit om de OpenRefine te downloaden.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Pak het gedownloade bestand uit door onderstaande opdracht uit te voeren.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Start de OpenRefine.
$ ./refine
Refine wordt dan geopend in uw webbrowser. Als het niet automatisch begint, typt u http: // localhost: 3333 om er toegang toe te krijgen.
Installeren op Mac
Download Mac Kit van httpsopenrefineorgdownloadhtml. Open en sleep het pictogram naar de map Toepassingen. Dubbelklik op het pictogram en Refine wordt geopend in de webbrowser.
op Windows installeren
Download Windows Kit van httpsopenrefineorgdownloadhtml. Uit het gedownloade bestand los en dubbelklik op het bestand Refine.bat. Refine wordt dan geopend in uw webbrowser. Als het niet automatisch begint, typt u http: // localhost: 3333 om er toegang toe te krijgen.