Open source big data tool

OpenRefine Open source big data tool

Gratis big data -oplossing voor het verwerken van grootschalige complexe gegevens

Krachtig gratis big data-platform voor het verkennen, transformeren en verzoenen van grootschalige rommelige gegevens. Breid het uit met webservices en externe gegevenssets.

Overzicht

OpenRefine (eerder Google Refine) is een open source big data -tool voor het werken met complexe datasets. Het is een gratis big data -platform voor het manipuleren van gegevens. Het helpt gebruikers om verknipte gegevens op te ruimen en om te converteren naar een ander formaat. Verder maakt OpenRefine het uit te breiden van datasets met verschillende webservices. OpenRefine heeft een API die kan worden gebruikt om te integreren met services van derden en bewerkingen te automatiseren. De extensies kunnen worden gebruikt om deze big data -oplossing uit te breiden. Gebruikers kunnen extensies eenvoudig downloaden en installeren om de functionaliteit van het programma te verbeteren. Onderzoek, facetten, transformeren, verzoenen, exporteren en nog veel meer functies zijn beschikbaar in OpenRefine voor het werken met datasets. Met faceting kunnen gebruikers een kolom zoeken naar patronen, trends en gegevensvariatie. Met de expressiefunctie in OpenRefine kunnen gebruikers gegevens reinigen en transformeren. Wikidata is een vrije en open kennisbron die zowel mensen als machines kunnen lezen en bewerken. OpenRefine heeft een functie waarmee gebruikers gegevens kunnen ophalen en toevoegen aan Wikidata. Het heeft een robuust hulpmiddel voor het exporteren van gegevens naar verschillende formaten en externe bronnen. Gebruikers kunnen gegevens uploaden naar Google Sheets en deze ook aan Wikidata toevoegen. Deze open source big data -tool is beschikbaar voor Windows-, Mac- en Linux -besturingssystemen. Gebruikers kunnen bibliotheken van derden vinden voor verschillende programmeertalen zoals PHP, Java, Python, Ruby en nog veel meer voor het automatiseren van de bewerkingen. OpenRefine is geschreven in Java en de licentie voor deze grote oplossing is BSD-3.

Systeem vereisten

Om OpenRefine te installeren, moet u de volgende software hebben:

  • Java 8
  • Apache Maven

Functies

Hierna volgen de belangrijkste kenmerken van OpenRefine:

  • Gratis en open source
  • Gegevensreiniging en filteren
  • Importeer gegevens uit verschillende formaten
  • Gegevensafstemming en matching
  • Aangepaste vraagtaal met GREL- en PYTHON -ondersteuning
  • Verrijk gegevens via API’s
  • Transformatie van gegevens
  • Gegevens koppelen
  • Geavanceerde gegevensbewerkingen

Installatie

Installeren op Linux

Voer de onderstaande opdracht uit om de OpenRefine te downloaden.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Pak het gedownloade bestand uit door onderstaande opdracht uit te voeren.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Start de OpenRefine.

$ ./refine

Refine wordt dan geopend in uw webbrowser. Als het niet automatisch begint, typt u http: // localhost: 3333 om er toegang toe te krijgen.

Installeren op Mac

Download Mac Kit van httpsopenrefineorgdownloadhtml. Open en sleep het pictogram naar de map Toepassingen. Dubbelklik op het pictogram en Refine wordt geopend in de webbrowser.

op Windows installeren

Download Windows Kit van httpsopenrefineorgdownloadhtml. Uit het gedownloade bestand los en dubbelklik op het bestand Refine.bat. Refine wordt dan geopend in uw webbrowser. Als het niet automatisch begint, typt u http: // localhost: 3333 om er toegang toe te krijgen.

Ontdekken

Mogelijk vindt u de volgende links relevant:

 Nederlands