OpenRefine Εργαλείο μεγάλου δεδομένων ανοιχτού κώδικα
Δωρεάν λύση μεγάλων δεδομένων για τη διαχείριση σύνθετων δεδομένων μεγάλης κλίμακας
Ισχυρή δωρεάν πλατφόρμα μεγάλων δεδομένων για την εξερεύνηση, τη μετατροπή και τη συμφιλίωση των μεγάλων δεδομένων βρώμικων. Επεκτείνετε το με υπηρεσίες ιστού και εξωτερικά σύνολα δεδομένων.
ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ
Το OpenRefine (προηγουμένως Google refine) είναι ένα εργαλείο μεγάλου δεδομένων ανοιχτού κώδικα για την εργασία με σύνθετα σύνολα δεδομένων. Είναι μια δωρεάν πλατφόρμα μεγάλων δεδομένων για τον χειρισμό δεδομένων. Βοηθά τους χρήστες να καθαρίσουν τα αναστατωμένα δεδομένα και να τα μετατρέψουν σε διαφορετική μορφή. Επιπλέον, το OpenRefine επιτρέπει την επέκταση των συνόλων δεδομένων με διάφορες υπηρεσίες ιστού. Το OpenRefine έχει ένα API που μπορεί να χρησιμοποιηθεί για να ενσωματωθεί με υπηρεσίες τρίτων και αυτοματοποίησης λειτουργιών. Οι επεκτάσεις μπορούν να χρησιμοποιηθούν για την επέκταση αυτής της μεγάλης λύσης δεδομένων. Οι χρήστες μπορούν εύκολα να κατεβάσουν και να εγκαταστήσουν επεκτάσεις για να βελτιώσουν τη λειτουργικότητα του προγράμματος. Εξερεύνηση, πτυχές, μετασχηματισμός, συμφιλίωση, εξαγωγή και πολλά άλλα χαρακτηριστικά είναι διαθέσιμα στην OpenRefine για συνεργασία με σύνολα δεδομένων. Το Faceting επιτρέπει στους χρήστες να αναζητούν μια στήλη για μοτίβα, τάσεις και διακύμανση δεδομένων. Το χαρακτηριστικό έκφρασης στο OpenRefine επιτρέπει στους χρήστες να καθαρίζουν και να μετατρέπουν δεδομένα. Το Wikidata είναι μια ελεύθερη και ανοιχτή πηγή γνώσεων που μπορούν να διαβάσουν και να επεξεργαστούν τόσο οι άνθρωποι όσο και τα μηχανήματα. Το OpenRefine διαθέτει ένα χαρακτηριστικό που επιτρέπει στους χρήστες να φέρνουν και να προσθέτουν δεδομένα στο Wikidata. Έχει ένα ισχυρό εργαλείο για την εξαγωγή δεδομένων σε διάφορες μορφές και εξωτερικές πηγές. Οι χρήστες μπορούν να ανεβάσουν δεδομένα σε φύλλα Google και να τα προσθέσουν και στο Wikidata. Αυτό το εργαλείο μεγάλων δεδομένων ανοιχτού κώδικα είναι διαθέσιμο για λειτουργικά συστήματα Windows, Mac και Linux. Οι χρήστες μπορούν να βρουν βιβλιοθήκες τρίτων για διάφορες γλώσσες προγραμματισμού όπως η PHP, η Java, η Python, η Ruby και πολλά άλλα για την αυτοματοποίηση των λειτουργιών. Το OpenRefine είναι γραμμένο στη Java και η άδεια για αυτή τη μεγάλη λύση είναι η BSD-3.
Απαιτήσεις συστήματος
Για να εγκαταστήσετε το OpenRefine, πρέπει να έχετε τα ακόλουθα λογισμικά:
- Java 8
- Apache Maven
Χαρακτηριστικά
Ακολουθούν τα βασικά χαρακτηριστικά του OpenRefine:
- Δωρεάν και ανοιχτή πηγή
- Καθαρισμός και φιλτράρισμα δεδομένων
- Εισαγωγή δεδομένων από διάφορες μορφές
- Συμφιλίωση και αντιστοίχιση δεδομένων
- Προσαρμοσμένη γλώσσα ερωτήματος με υποστήριξη Grel και Python
- Εμπλουτίστε τα δεδομένα μέσω API
- Μετασχηματισμός δεδομένων
- Σύνδεση δεδομένων
- Προηγμένες λειτουργίες δεδομένων
Εγκατάσταση
Εγκατάσταση στο Linux
Εκτελέστε παρακάτω εντολή για να κατεβάσετε το OpenRefine.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Εξαγάγετε το αρχείο που κατεβάστε εκτελώντας παρακάτω εντολή.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Ξεκινήστε την OpenRefine.
$ ./refine
Το REFINE θα ανοίξει στη συνέχεια στο πρόγραμμα περιήγησης ιστού σας. Εάν δεν ξεκινά αυτόματα, πληκτρολογήστε http: // localhost: 3333 για πρόσβαση σε αυτό.
Εγκατάσταση σε Mac
Κατεβάστε το κιτ Mac από httpsopenrefineorgdownloadhtml. Ανοίξτε και σύρετε εικονίδιο στο φάκελο εφαρμογών. Κάντε διπλό κλικ στο εικονίδιο και η βελτίωση θα ανοίξει στο πρόγραμμα περιήγησης ιστού.
Εγκατάσταση στα Windows
Κατεβάστε το Windows Kit από το httpsopenrefineorgdownloadhtml. Αποσυμπιέστε το αρχείο που κατεβάστε και κάντε διπλό κλικ στο αρχείο refine.bat. Το REFINE θα ανοίξει στη συνέχεια στο πρόγραμμα περιήγησης ιστού σας. Εάν δεν ξεκινά αυτόματα, πληκτρολογήστε http: // localhost: 3333 για πρόσβαση σε αυτό.