OpenRefine Ferramenta de big data de código aberto
Solução gratuita de big data para lidar com dados complexos em larga escala
Plataforma poderosa de big data gratuita para explorar, transformar e reconciliar dados confusos em larga escala. Estenda -o com serviços da Web e conjuntos de dados externos.
Visão geral
O OpenRefine (anteriormente o Google Refine) é uma ferramenta de big data de código aberto para trabalhar com conjuntos de dados complexos. É uma plataforma de big data gratuita para manipular dados. Ajuda os usuários a limpar dados confusos e convertê-los em um formato diferente. Além disso, o OpenRefine permite estender os conjuntos de dados com vários serviços da Web. O OpenRefine possui uma API que pode ser usada para se integrar aos serviços de terceiros e automatizar operações. As extensões podem ser usadas para expandir esta solução de big data. Os usuários podem baixar e instalar facilmente extensões para melhorar a funcionalidade do programa. Explorar, facetas, transformar, reconciliar, exportar e muitos outros recursos estão disponíveis no OpenRefine para trabalhar com conjuntos de dados. O FaceTing permite que os usuários pesquisem uma coluna por padrões, tendências e variação de dados. O recurso de expressão no OpenRefine permite que os usuários limpem e transformem dados. O Wikidata é uma fonte de conhecimento gratuita e aberta que humanos e máquinas podem ler e editar. O OpenRefine possui um recurso que permite aos usuários buscar e adicionar dados ao Wikidata. Possui uma ferramenta robusta para exportar dados para uma variedade de formatos e fontes externas. Os usuários podem fazer upload de dados nas folhas do Google e adicioná -los ao Wikidata também. Esta ferramenta de big data de código aberto está disponível para sistemas operacionais Windows, Mac e Linux. Os usuários podem encontrar bibliotecas de terceiros para várias linguagens de programação, como PHP, Java, Python, Ruby e muito mais para automatizar as operações. O OpenRefine está escrito em Java e a licença para esta grande solução é o BSD-3.
Requisitos de sistema
Para instalar o OpenRefine, você deve ter os seguintes softwares:
- Java 8
- Apache Maven
Características
A seguir, estão os principais recursos do OpenRefine:
- código aberto e de código aberto
- Limpeza e filtragem de dados
- importar dados de vários formatos
- Reconciliação de dados e correspondência
- linguagem de consulta personalizada com suporte Grel e Python
- enriquecer dados via APIs
- Transformação de dados
- vincular dados
- Operações de dados avançados
Instalação
Instalando no Linux
Execute o comando abaixo para baixar o OpenRefine.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Extraia o arquivo baixado executando o comando abaixo.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Comece o OpenRefine.
$ ./refine
Refine então abrirá no seu navegador da web. Se não iniciar automaticamente, digite http: // localhost: 3333 para acessá -lo.
Instalando no Mac
Baixe o kit Mac de httpsopenRefineorgdownloadhtml. Abra e arraste o ícone para a pasta Aplicativos. Clique duas vezes no ícone e refino será aberto no navegador da web.
Instalando no Windows
Faça o download do kit do Windows de httpsopenRefineorgdownloadhtml. Descompacte o arquivo baixado e clique duas vezes no arquivo refine.bat. Refine então abrirá no seu navegador da web. Se não iniciar automaticamente, digite http: // localhost: 3333 para acessá -lo.