Ferramenta de big data de código aberto

OpenRefine Ferramenta de big data de código aberto

Solução gratuita de big data para lidar com dados complexos em larga escala

Plataforma poderosa de big data gratuita para explorar, transformar e reconciliar dados confusos em larga escala. Estenda -o com serviços da Web e conjuntos de dados externos.

Visão geral

O OpenRefine (anteriormente o Google Refine) é uma ferramenta de big data de código aberto para trabalhar com conjuntos de dados complexos. É uma plataforma de big data gratuita para manipular dados. Ajuda os usuários a limpar dados confusos e convertê-los em um formato diferente. Além disso, o OpenRefine permite estender os conjuntos de dados com vários serviços da Web. O OpenRefine possui uma API que pode ser usada para se integrar aos serviços de terceiros e automatizar operações. As extensões podem ser usadas para expandir esta solução de big data. Os usuários podem baixar e instalar facilmente extensões para melhorar a funcionalidade do programa. Explorar, facetas, transformar, reconciliar, exportar e muitos outros recursos estão disponíveis no OpenRefine para trabalhar com conjuntos de dados. O FaceTing permite que os usuários pesquisem uma coluna por padrões, tendências e variação de dados. O recurso de expressão no OpenRefine permite que os usuários limpem e transformem dados. O Wikidata é uma fonte de conhecimento gratuita e aberta que humanos e máquinas podem ler e editar. O OpenRefine possui um recurso que permite aos usuários buscar e adicionar dados ao Wikidata. Possui uma ferramenta robusta para exportar dados para uma variedade de formatos e fontes externas. Os usuários podem fazer upload de dados nas folhas do Google e adicioná -los ao Wikidata também. Esta ferramenta de big data de código aberto está disponível para sistemas operacionais Windows, Mac e Linux. Os usuários podem encontrar bibliotecas de terceiros para várias linguagens de programação, como PHP, Java, Python, Ruby e muito mais para automatizar as operações. O OpenRefine está escrito em Java e a licença para esta grande solução é o BSD-3.

Requisitos de sistema

Para instalar o OpenRefine, você deve ter os seguintes softwares:

  • Java 8
  • Apache Maven

Características

A seguir, estão os principais recursos do OpenRefine:

  • código aberto e de código aberto
  • Limpeza e filtragem de dados
  • importar dados de vários formatos
  • Reconciliação de dados e correspondência
  • linguagem de consulta personalizada com suporte Grel e Python
  • enriquecer dados via APIs
  • Transformação de dados
  • vincular dados
  • Operações de dados avançados

Instalação

Instalando no Linux

Execute o comando abaixo para baixar o OpenRefine.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Extraia o arquivo baixado executando o comando abaixo.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Comece o OpenRefine.

$ ./refine

Refine então abrirá no seu navegador da web. Se não iniciar automaticamente, digite http: // localhost: 3333 para acessá -lo.

Instalando no Mac

Baixe o kit Mac de httpsopenRefineorgdownloadhtml. Abra e arraste o ícone para a pasta Aplicativos. Clique duas vezes no ícone e refino será aberto no navegador da web.

Instalando no Windows

Faça o download do kit do Windows de httpsopenRefineorgdownloadhtml. Descompacte o arquivo baixado e clique duas vezes no arquivo refine.bat. Refine então abrirá no seu navegador da web. Se não iniciar automaticamente, digite http: // localhost: 3333 para acessá -lo.

Explore

Você pode encontrar os seguintes links relevantes:

 Português