Porco

Um ambiente de programação de DataFlow para processar arquivos muito grandes
Baixe Agora

Porco Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Apache
  • Preço:
  • FREE
  • Nome do editor:
  • Apache Software Foundation
  • Site do editor:
  • http://www.apache.org/
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 31 MB

Porco Tag


Porco Descrição

Um ambiente de programação de DataFlow para processamento de arquivos muito grandes O porco é uma plataforma aberta e gratuita para analisar grandes conjuntos de dados que consistem em uma linguagem de alto nível para expressar programas de análise de dados, juntamente com infraestrutura para avaliar esses programas. A propriedade saliente dos programas de porcos é que sua estrutura é passível de paralelização substancial, que em turnos permite lhes lidar com conjuntos de dados muito grandes.at o tempo presente, a camada de infraestrutura do porco consiste em um compilador que produz sequências de programas de redução de mapas, quais implementações paralelas em larga escala já existem (por exemplo, o subprojeto do Hadoop). Atualmente, a camada de idioma do porco consiste em uma linguagem textual chamada latim do porco, que tem as seguintes propriedades importantes: · Facilidade de programação. É trivial alcançar a execução paralela de tarefas de análise de dados simples e "embaraçosamente paralelamente paralelamente". Tarefas complexas compostas de várias transformações de dados inter-relacionadas são explicitamente codificadas como sequências de fluxo de dados, tornando-as fáceis de escrever, entender e manter. · Oportunidades de otimização. A maneira como as tarefas são codificadas permite que o sistema otimize automaticamente sua execução, permitindo que o usuário se concentre em semântica em vez de eficiência. · Extensibilidade. Os usuários podem criar suas próprias funções para fazer processamento especial. Requisitos: · Java 1.6.x ou posterior · Ant. · Hadoop 0.18.x. O que há de novo nesta versão: · O foco principal desta versão é o suporte da multiceração que permite otimizar várias consultas dentro do mesmo script que compartilham uma computação.


Porco Software Relacionado