开源大数据工具

OpenRefine 开源大数据工具

免费处理大型复杂数据的大数据解决方案

强大的免费大数据平台,用于探索,转换和调解大规模凌乱的数据。使用Web服务和外部数据集扩展它。

概述

OpenRefine(以前是Google Refine)是用于使用复杂数据集的开源大数据工具。这是一个免费的大数据平台,用于操纵数据。它可以帮助用户清理混乱的数据并将其转换为其他格式。此外,OpenRefine允许使用各种Web服务扩展数据集。 OpenRefine具有可用于与第三方服务和自动化操作集成的API。扩展名可用于扩展此大数据解决方案。用户可以轻松下载和安装扩展名来改善程序的功能。 探索,方面,转换,核对,导出和更多功能可在OpenRefine中用于使用数据集。 FaceTing允许用户搜索列以获取模式,趋势和数据变化。 OpenRefine中的表达功能使用户可以清洁和转换数据。 Wikidata是人类和机器都可以阅读和编辑的免费开放知识来源。 OpenRefine具有允许用户获取并将数据添加到Wikidata的功能。它具有可靠的工具,可将数据导出到各种格式和外部来源。用户可以将数据上传到Google表格,并将其添加到Wikidata。 此开源大数据工具可用于Windows,Mac和Linux操作系统。用户可以找到用于各种编程语言的第三方库,例如PHP,Java,Python,Ruby等,以自动化操作。 OpenRefine用Java编写,该大解决方案的许可是BSD-3。

系统要求

为了安装OpenRefine,您必须具有以下软件: -Java 8

  • Apache Maven

特征

以下是OpenRefine的关键特征:

  • 免费和开源
  • 数据清洁和过滤
  • 从各种格式导入数据
  • 数据核对与匹配
  • 带有GREL和PYTHON支持的自定义查询语言
  • 通过API丰富数据
  • 数据转换
  • 链接数据
  • 高级数据操作

安装

在Linux上安装

在下面运行命令以下载OpenRefine。

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

通过在下面的命令下运行下载的文件。

$ tar -xzf openrefine-linux-3.4.1.tar.gz

启动OpenRefine。

$ ./refine

然后,精炼将在您的Web浏览器中打开。如果没有自动启动,请键入http:// localhost:3333访问它。

在Mac上安装

httpsopenrefineorgdownloadhtml下载Mac套件。 打开并将图标拖到应用程序文件夹中。 双击图标,精炼将在Web浏览器中打开。

在窗户上安装

httpsopenrefineorgdownloadhtml下载Windows套件。 解压缩下载的文件,然后双击Preatine.bat文件。 然后,精炼将在您的Web浏览器中打开。如果没有自动启动,请键入http:// localhost:3333访问它。

 简体中文