OpenRefine Açık Kaynak Büyük Veri Aracı
Büyük ölçekli karmaşık verilerin işlenmesi için ücretsiz büyük veri çözümü
Büyük ölçekli dağınık verileri keşfetmek, dönüştürmek ve uzlaştırmak için güçlü ücretsiz büyük veri platformu. Web hizmetleri ve harici veri kümeleri ile genişletin.
Genel Bakış
OpenRefine (daha önce Google Refine), karmaşık veri kümeleriyle çalışmak için açık kaynaklı bir büyük veri aracıdır. Verileri manipüle etmek için ücretsiz büyük bir veri platformudur. Kullanıcıların dağınık verileri temizlemelerine ve farklı bir formata dönüştürmelerine yardımcı olur. Ayrıca, OpenRefine, çeşitli web hizmetleriyle veri kümelerinin genişletilmesine izin verir. OpenRefine, üçüncü taraf hizmetlerle entegre etmek ve işlemleri otomatikleştirmek için kullanılabilecek bir API’ya sahiptir. Uzantılar bu büyük veri çözümünü genişletmek için kullanılabilir. Kullanıcılar, programın işlevselliğini geliştirmek için uzantıları kolayca indirip yükleyebilir. Veri kümeleriyle çalışmak için OpenRefine’de keşfetmek, fasetleri, dönüştürmek, uzlaşma, ihraç etmek ve daha birçok özellik mevcuttur. Faceting, kullanıcıların desenler, eğilimler ve veri değişimi için bir sütun aramalarına olanak tanır. OpenRefine’deki ifade özelliği, kullanıcıların verileri temizlemesine ve dönüştürmesine olanak tanır. Wikidata, hem insanların hem de makinelerin okuyabileceği ve düzenleyebileceği ücretsiz ve açık bir bilgi kaynağıdır. OpenRefine, kullanıcıların Wikidata’ya veri getirmesini ve veri eklemesini sağlayan bir özelliğe sahiptir. Verileri çeşitli formatlara ve harici kaynaklara dışa aktarmak için sağlam bir araca sahiptir. Kullanıcılar Google sayfalarına veri yükleyebilir ve Wikidata’ya da ekleyebilir. Bu açık kaynaklı büyük veri aracı Windows, Mac ve Linux işletim sistemleri için kullanılabilir. Kullanıcılar, işlemleri otomatikleştirmek için PHP, Java, Python, Ruby ve daha fazlası gibi çeşitli programlama dilleri için üçüncü taraf kütüphaneleri bulabilirler. OpenRefine Java ile yazılmıştır ve bu büyük çözümün lisansı BSD-3’tür.
Sistem gereksinimleri
OpenRefine’yi kurmak için aşağıdaki yazılımlara sahip olmanız gerekir:
- Java 8
- Apache Maven
Özellikler
OpenRefine’nin temel özellikleri aşağıdadır:
- Ücretsiz ve açık kaynak
- Veri temizleme ve filtreleme
- Çeşitli biçimlerden verileri içe aktarın
- Veri mutabakatı ve eşleştirme
- Grel ve Python desteği ile özel sorgu dili
- API’ler aracılığıyla verileri zenginleştirin
- Verilerin dönüşümü
- Verileri bağlama
- Gelişmiş Veri İşlemleri
Kurulum
Linux’a yükleme
OpenRefine’yi indirmek için aşağıdaki komutu çalıştırın.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Aşağıdaki komutu çalıştırarak indirilen dosyayı çıkarın.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
OpenRefine’yi başlatın.
$ ./refine
Rafine daha sonra web tarayıcınızda açılacaktır. Otomatik olarak başlamazsa, erişmek için http: // localhost: 3333 yazın.
Mac üzerine yükleme
Mac kitini httpsopenrefineStownloadhtml‘dan indirin. Uygulamalar klasörüne açın ve simgesini sürükleyin. Simgeye çift tıklayın ve Web tarayıcısında rafine açılacaktır.
Pencerelere Yükleme
httpsopenrefineStownloadhtml‘dan Windows kitini indirin. İndirilen dosyayı açın ve rafine.bat dosyasına çift tıklayın. Rafine daha sonra web tarayıcınızda açılacaktır. Otomatik olarak başlamazsa, erişmek için http: // localhost: 3333 yazın.