OpenRefine Alat Data Besar Sumber Terbuka
Solusi data besar gratis untuk menangani data kompleks skala besar
Platform data besar gratis yang kuat untuk mengeksplorasi, mengubah, dan merekonsiliasi data berantakan skala besar. Perluas dengan layanan web dan kumpulan data eksternal.
Ringkasan
OpenRefine (sebelumnya Google Refine) adalah alat data besar open source untuk bekerja dengan set data yang kompleks. Ini adalah platform data besar gratis untuk memanipulasi data. Ini membantu pengguna untuk membersihkan data yang berantakan dan mengubahnya menjadi format yang berbeda. Selanjutnya, OpenRefine memungkinkan perpanjangan kumpulan data dengan berbagai layanan web. OpenRefine memiliki API yang dapat digunakan untuk berintegrasi dengan layanan pihak ketiga dan mengotomatiskan operasi. Ekstensi dapat digunakan untuk memperluas solusi data besar ini. Pengguna dapat dengan mudah mengunduh dan menginstal ekstensi untuk meningkatkan fungsionalitas program. Menjelajahi, segi, mengubah, rekonsiliasi, ekspor, dan banyak lagi fitur tersedia di OpenRefine untuk bekerja dengan set data. Faceting memungkinkan pengguna untuk mencari kolom untuk pola, tren, dan variasi data. Fitur ekspresi di OpenRefine memungkinkan pengguna untuk membersihkan dan mengubah data. Wikidata adalah sumber pengetahuan gratis dan terbuka yang dapat dibaca dan diedit oleh manusia. OpenRefine memiliki fitur yang memungkinkan pengguna untuk mengambil dan menambahkan data ke wikidata. Ini memiliki alat yang kuat untuk mengekspor data ke berbagai format dan sumber eksternal. Pengguna dapat mengunggah data ke Google Sheets dan menambahkannya ke Wikidata juga. Alat data besar open source ini tersedia untuk sistem operasi Windows, Mac, dan Linux. Pengguna dapat menemukan perpustakaan pihak ketiga untuk berbagai bahasa pemrograman seperti PHP, Java, Python, Ruby, dan banyak lagi untuk mengotomatisasi operasi. OpenRefine ditulis dalam Java dan lisensi untuk solusi besar ini adalah BSD-3.
Persyaratan sistem
Untuk menginstal OpenRefine, Anda harus memiliki perangkat lunak berikut:
- Java 8
- Apache Maven
Fitur
Berikut ini adalah fitur utama OpenRefine:
- Sumber Gratis dan Terbuka
- Pembersihan dan penyaringan data
- Impor data dari berbagai format
- Rekonsiliasi dan pencocokan data
- Bahasa kueri khusus dengan dukungan grel dan python
- memperkaya data melalui API
- Transformasi data
- Menghubungkan data
- Operasi Data Lanjutan
Instalasi
Menginstal di Linux
Jalankan perintah di bawah untuk mengunduh OpenRefine.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Ekstrak file yang diunduh dengan menjalankan perintah di bawah ini.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Mulai OpenRefine.
$ ./refine
Refine kemudian akan dibuka di browser web Anda. Jika tidak dimulai secara otomatis, ketik http: // localhost: 3333 untuk mengaksesnya.
Menginstal di Mac
Unduh Mac Kit dari httpsopenrefineorgdownloadhtml. Buka dan seret ikon ke folder Aplikasi. Klik dua kali pada ikon dan perbaikan akan terbuka di browser web.
Menginstal di Windows
Unduh Windows Kit dari httpsopenrefineorgdownloadhtml. Buka zip file yang diunduh dan klik dua kali pada file Refine.bat. Refine kemudian akan dibuka di browser web Anda. Jika tidak dimulai secara otomatis, ketik http: // localhost: 3333 untuk mengaksesnya.