Инструмент больших данных с открытым исходным кодом

OpenRefine Инструмент больших данных с открытым исходным кодом

Бесплатное решение больших данных для обработки крупномасштабных сложных данных

Мощная бесплатная платформа больших данных для изучения, преобразования и примирения крупномасштабных грязных данных. Расширить его на веб -службы и внешние наборы данных.

Обзор

OpenRefine (ранее Google Refine) - это инструмент больших данных с открытым исходным кодом для работы со сложными наборами данных. Это бесплатная платформа больших данных для манипулирования данными. Это помогает пользователям очищать запутанные данные и преобразовать их в другой формат. Кроме того, OpenRefine позволяет расширять наборы данных с различными веб -службами. OpenRefine имеет API, который может использоваться для интеграции со сторонними услугами и автоматизацией операций. Расширения можно использовать для расширения этого решения для больших данных. Пользователи могут легко загружать и устанавливать расширения для улучшения функциональности программы. Изучение, аспекты, преобразование, примирение, экспорт и многие другие функции доступны в OpenRefine для работы с наборами данных. Фетяние позволяет пользователям искать столбец для шаблонов, тенденций и изменений данных. Функция выражения в OpenRefine позволяет пользователям чистить и преобразовать данные. Wikidata - это бесплатный и открытый источник знаний, который могут читать и редактировать как люди, так и машины. OpenRefine имеет функцию, которая позволяет пользователям получать и добавлять данные в Wikidata. Он имеет надежный инструмент для экспорта данных в различные форматы и внешние источники. Пользователи могут загружать данные в Google Sheets и добавить их в Wikidata. Этот инструмент с большими данными с открытым исходным кодом доступен для операционных систем Windows, Mac и Linux. Пользователи могут найти сторонние библиотеки для различных языков программирования, таких как PHP, Java, Python, Ruby и многие другие для автоматизации операций. OpenRefine написан на Java, а лицензия на это большое решение-BSD-3.

Системные Требования

Чтобы установить OpenRefine, вы должны иметь следующие программные обеспечения:

  • Java 8
  • Apache Maven

Функции

Ниже приведены ключевые особенности OpenRefine:

  • Бесплатный и открытый исходный код
  • Очистка и фильтрация данных
  • Импорт данных из различных форматов
  • Согласование данных и сопоставление
  • Индивидуальный язык запросов с поддержкой Grel и Python
  • обогатить данные с помощью API
  • Преобразование данных
  • Связывание данных
  • расширенные операции данных

Монтаж

Установка на Linux

Запустите команду ниже, чтобы загрузить OpenRefine.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Извлеките загруженный файл с помощью команды ниже.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Начните OpenRefine.

$ ./refine

Refine затем откроется в вашем веб -браузере. Если он не запускается автоматически, введите http: // localhost: 3333, чтобы получить к нему доступ.

Установка на Mac

Скачать Mac Kit из httpsopenrefineorgdownloadhtml. Откройте и перетащите значок в папку приложений. Дважды щелкните значок, и Refine откроется в веб -браузере.

Установка на Windows

Скачать комплект Windows от httpsopenrefineorgdownloadhtml. Разанипируйте загруженный файл и дважды щелкните файл refine.bat. Refine затем откроется в вашем веб -браузере. Если он не запускается автоматически, введите http: // localhost: 3333, чтобы получить к нему доступ.

Исследовать

Вы можете найти следующие ссылки актуальными:

 Русский