Terrier.

Um kit de ferramentas java probabilístico para a construção de mecanismos de pesquisa.
Baixe Agora

Terrier. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • MPL
  • Preço:
  • FREE
  • Nome do editor:
  • University of Glasgow
  • Site do editor:
  • http://ir.dcs.gla.ac.uk/terrier/

Terrier. Tag


Terrier. Descrição

Um kit de ferramentas java probabilístico para construir mecanismos de busca. O Projeto Terrier é um Follower Toolkit de Java probabilístico para a construção de mecanismos de busca.terrier é o software para o rápido desenvolvimento de mecanismos de pesquisa da Web, Intranet e desktop. Mais geralmente, é uma plataforma modular para construir aplicações de recuperação de informações em larga escala, fornecendo funcionalidades de recuperação de indexação e recuperação probabilística. Ele vem com um aplicativo de pesquisa de desktop.terrier tem vários recursos de ponta, incluindo abordagens de recuperação probilística sem parâmetros (como divergência de modelos de aleatoriedade), metodologias automáticas de expansão / reformulação e técnicas de compressão de dados eficientes. Terrier vem com um poderoso aplicativo de pesquisa de desktop de prova de conceito e recursos completos da TREC, incluindo a capacidade de indexar, consultar e avaliar as coleções padrão da TREC, como AP, WSJ, WT10G, .gov e .gov2. Terrier é escrito em Java e foi usado com sucesso para recuperação adhoc, pesquisa na web e recuperação cruzada, em uma configuração centralizada ou distribuída. Atualmente, também está sendo usado para executar várias aplicações. Aqui estão algumas características principais de "Terrier": · Open Source (Mozilla Public License) · Escrito em Java Cross-platform · Estruturas de dados de disco altamente compactadas. · Manipulando coleções de documentos em larga escala. · Arquivo direto para expansão de consulta eficiente. · Indexação modular e aberta e APIs de consultas. · Testado para indexação e recuperação de coleções padrão do teste TREC. · Aplicação de consulta interativa. · Aplicativo de pesquisa de desktop para pesquisar vários tipos de documentos. · Entrada / saída de inteiros codificados gama, unário e binário para compactar fluxos ou arquivos de acesso aleatório. · Avaliação padrão do TREC ad-hoc e resultados de recuperação de itens conhecidos. · Indexação de coleções de documentos marcadas, bem como documentos de vários formatos, como arquivos HTML, PDF ou Microsoft Word, Excel e PowerPoint. · Indexação de informações de campo. · Indexação de informações sobre a posição em uma palavra, ou um nível de bloco. · Suporte para modelos de recuperação clássicos, como o modelo de linguagem TF-IDF, BM25 e Ponte-Croft, e expansão de consulta de Rocchio. · Fornece uma série de modelos de classificação de documentos da Divergência (DFR). · Fornece um número de modelos de ponderação de prazo DFR sem parâmetros para expansão automática de consulta. · Linguagem de consulta avançada que suporta e não operadores, frase e busca de proximidade. · Processamento flexível de termos através de um gasoduto de componentes, como removedores de palavras de parada e summers. O que há de novo nesta versão: · Esta é uma atualização substancial, que inclui novo suporte para Hadoop, principalmente um mapa do Hadoop reduzem o sistema de indexação, permitindo que grandes coleções de documentos sejam indexadas de forma altamente distribuída. · Também estão incluídas várias melhorias menores, incluindo o suporte aprimorado para a coleção IIT CDIP1 (TRC Legal Track), e várias correções de bugs. · Isto pretende ser o lançamento final na série 2.x.


Terrier. Software Relacionado

O criador

O fabricante é um sistema de gerenciamento de conteúdo (CMS) para sites. ...

212

Download

Bewelcome Rox.

Bewelcome Rox é uma plataforma de rede social para criar sites de hospitalidade / viagem com base inteiramente no software de código aberto. ...

210

Download