OpenRefine Инструмент больших данных с открытым исходным кодом
Бесплатное решение больших данных для обработки крупномасштабных сложных данных
Мощная бесплатная платформа больших данных для изучения, преобразования и примирения крупномасштабных грязных данных. Расширить его на веб -службы и внешние наборы данных.
Обзор
OpenRefine (ранее Google Refine) - это инструмент больших данных с открытым исходным кодом для работы со сложными наборами данных. Это бесплатная платформа больших данных для манипулирования данными. Это помогает пользователям очищать запутанные данные и преобразовать их в другой формат. Кроме того, OpenRefine позволяет расширять наборы данных с различными веб -службами. OpenRefine имеет API, который может использоваться для интеграции со сторонними услугами и автоматизацией операций. Расширения можно использовать для расширения этого решения для больших данных. Пользователи могут легко загружать и устанавливать расширения для улучшения функциональности программы. Изучение, аспекты, преобразование, примирение, экспорт и многие другие функции доступны в OpenRefine для работы с наборами данных. Фетяние позволяет пользователям искать столбец для шаблонов, тенденций и изменений данных. Функция выражения в OpenRefine позволяет пользователям чистить и преобразовать данные. Wikidata - это бесплатный и открытый источник знаний, который могут читать и редактировать как люди, так и машины. OpenRefine имеет функцию, которая позволяет пользователям получать и добавлять данные в Wikidata. Он имеет надежный инструмент для экспорта данных в различные форматы и внешние источники. Пользователи могут загружать данные в Google Sheets и добавить их в Wikidata. Этот инструмент с большими данными с открытым исходным кодом доступен для операционных систем Windows, Mac и Linux. Пользователи могут найти сторонние библиотеки для различных языков программирования, таких как PHP, Java, Python, Ruby и многие другие для автоматизации операций. OpenRefine написан на Java, а лицензия на это большое решение-BSD-3.
Системные Требования
Чтобы установить OpenRefine, вы должны иметь следующие программные обеспечения:
- Java 8
- Apache Maven
Функции
Ниже приведены ключевые особенности OpenRefine:
- Бесплатный и открытый исходный код
- Очистка и фильтрация данных
- Импорт данных из различных форматов
- Согласование данных и сопоставление
- Индивидуальный язык запросов с поддержкой Grel и Python
- обогатить данные с помощью API
- Преобразование данных
- Связывание данных
- расширенные операции данных
Монтаж
Установка на Linux
Запустите команду ниже, чтобы загрузить OpenRefine.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Извлеките загруженный файл с помощью команды ниже.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Начните OpenRefine.
$ ./refine
Refine затем откроется в вашем веб -браузере. Если он не запускается автоматически, введите http: // localhost: 3333, чтобы получить к нему доступ.
Установка на Mac
Скачать Mac Kit из httpsopenrefineorgdownloadhtml. Откройте и перетащите значок в папку приложений. Дважды щелкните значок, и Refine откроется в веб -браузере.
Установка на Windows
Скачать комплект Windows от httpsopenrefineorgdownloadhtml. Разанипируйте загруженный файл и дважды щелкните файл refine.bat. Refine затем откроется в вашем веб -браузере. Если он не запускается автоматически, введите http: // localhost: 3333, чтобы получить к нему доступ.