Outil de Big Data open source

OpenRefine Outil de Big Data open source

Solution gratuite de Big Data pour gérer des données complexes à grande échelle

Plateforme de Big Data gratuite puissante pour explorer, transformer et réconcilier des données désordonnées à grande échelle. Étendez-le avec les services Web et les ensembles de données externes.

Aperçu

OpenRefine (auparavant Google Refine) est un outil de Big Data open source pour travailler avec des ensembles de données complexes. Il s’agit d’une plate-forme Big Data gratuite pour manipuler les données. Il aide les utilisateurs à nettoyer les données gâchées et à les convertir en un format différent. De plus, OpenRefine permet d’extension des ensembles de données avec divers services Web. OpenRefine a une API qui peut être utilisée pour s’intégrer aux services tiers et automatiser les opérations. Les extensions peuvent être utilisées pour étendre cette solution de Big Data. Les utilisateurs peuvent facilement télécharger et installer des extensions pour améliorer les fonctionnalités du programme. L’exploration, les facettes, la transformation, la réconciliation, l’exportation et de nombreuses autres fonctionnalités sont disponibles dans OpenRefine pour travailler avec des ensembles de données. Facet permet aux utilisateurs de rechercher une colonne pour les modèles, les tendances et la variation des données. La fonction d’expression dans OpenRefine permet aux utilisateurs de nettoyer et de transformer les données. Wikidata est une source de connaissances gratuite et ouverte que les humains et les machines peuvent lire et modifier. OpenRefine a une fonctionnalité qui permet aux utilisateurs de récupérer et d’ajouter des données à Wikidata. Il dispose d’un outil robuste pour exporter des données vers une variété de formats et de sources externes. Les utilisateurs peuvent télécharger des données sur Google Sheets et l’ajouter également à Wikidata. Cet outil Open Source Big Data est disponible pour les systèmes d’exploitation Windows, Mac et Linux. Les utilisateurs peuvent trouver des bibliothèques tierces pour divers langages de programmation tels que PHP, Java, Python, Ruby et bien d’autres pour automatiser les opérations. OpenRefine est écrite en Java et la licence pour cette grande solution est BSD-3.

Configuration requise

Pour installer OpenRefine, vous devez avoir les logiciels suivants:

  • Java 8
  • Apache Maven

Caractéristiques

Voici les principales caractéristiques d’OpenRefine:

  • gratuit et open source
  • Nettoyage et filtrage des données
  • Importer des données à partir de différents formats
  • Réconciliation des données et correspondance
  • Langue de requête personnalisée avec le support Grel et Python
  • Enrichir les données via des API
  • Transformation des données
  • lier les données
  • opérations de données avancées

Installation

Installation sur Linux

Exécutez la commande ci-dessous pour télécharger l’OpenRefine.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Extraire le fichier téléchargé en exécutant la commande ci-dessous.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Commencez l’OpenRefine.

$ ./refine

Affinera ensuite s’ouvrir dans votre navigateur Web. S’il ne démarre pas automatiquement, tapez http: // localhost: 3333 pour y accéder.

Installation sur Mac

Téléchargez le kit Mac à partir de httpsopeNrefineorgdownloadhtml. Icône ouvrir et glisser dans le dossier Applications. Double-cliquez sur l’icône et affinera s’ouvrir dans le navigateur Web.

Installation sur Windows

Téléchargez le kit Windows à partir de httpsopeNrefineorgdownloadhtml. Décompressez le fichier téléchargé et double-cliquez sur le fichier raffine.bat. Affinera ensuite s’ouvrir dans votre navigateur Web. S’il ne démarre pas automatiquement, tapez http: // localhost: 3333 pour y accéder.

Explorer

Vous pouvez trouver les liens suivants pertinents:

 Français