Terrier.

Terrier - mecanismo de pesquisa altamente flexível, eficiente e robusto, prontamente implantável em coleções de grande escala de documentos
Baixe Agora

Terrier. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Freeware
  • Preço:
  • FREE
  • Nome do editor:
  • University of Glasgow
  • Site do editor:
  • http://ir.dcs.gla.ac.uk/terrier/index.html
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 5.8 MB

Terrier. Tag


Terrier. Descrição

Terrier - motor de busca altamente flexível, eficiente e robusto, prontamente implantável em coleções de grande escala de documentos Terrier é um mecanismo de busca altamente flexível, eficiente, eficaz e robusto, prontamente implantável em coleções de grandes dimensões de documentos. Terrier implementa funcionalidades de indexação e recuperação de última geração. Terrier fornece uma plataforma ideal para o rápido desenvolvimento de aplicações de recuperação em larga escala. A versão de origem aberta do Terrier fornece uma plataforma flexível, abrangente, transparente e robusta para pesquisa e experimentação em recuperação de texto. A pesquisa colocada em terrier expande-se constantemente para novas Ramos do campo de recuperação de informações mais amplas, tornando o terrier uma plataforma ideal, forte, modular e de última geração para desenvolver, avaliar e avaliar novos conceitos e ideias.terrier é escrito em Java, e foi usado para Web e Enterprise Search, Desktop, Intranet e mecanismos de pesquisa verticais, bem como em desenvolvimento e avaliação de novas técnicas de recuperação de informações de texto em larga escala e aplicações.terrier está sendo desenvolvido no Departamento de Ciência da Computação, na Universidade de Glasgow.Aqui estão algumas principais características de "Terrier": Geral: · Suporte de indexação para formatos de arquivo de área de trabalho comuns, e para coleções de pesquisa TREC comumente usadas (por exemplo, TREC CDS 1-5, WT2G, WT10G, GOV, GOV2, blogs06). · Muitos modelos de ponderação de documentos, como muitas divergências livres de parâmetros de modelos de ponderação de aleatoriedade, OKAPI BM25 e modelagem de idiomas. · Linguagem de consulta convencional suportada, incluindo frases e termos ocorridos em tags. · Manipulação indexação de texto completo de coleções de documentos em grande escala, em uma arquitetura centralizada para pelo menos 25 milhões de documentos. · Indexação modular e aberta e APIs de consultas, para permitir a fácil extensão para suas próprias aplicações e pesquisa. · Pesquisa ativa de recuperação de informações alimentadas no Plataforma de código aberto. · Open Source (Mozilla Public License). · Escrito em Cross-platform Java - funciona no Windows, Mac OS X, Linux e Unix. · Grande base de usuário acima de 3 anos de lançamento público. A indexação da caixa de coleções de documentos marcada, como as coleções de teste da TREC. · Indexação de caixa para documentos de vários formatos, como arquivos HTML, PDF ou Microsoft Word, Excel e PowerPoint. · Indexação do campo informação, tal Como título, H1, HTML Tags Informações · Indexação de informações sobre a posição em uma palavra, ou um bloco (por exemplo, Uma janela de termos dentro de um nível de distância). · Suporte para várias codificações de documentos (UTF), para facilitar a recuperação multi-lingual. · Estruturas de dados de discos de índice altamente compactadas. · Arquivo direto altamente compactado para expansão de consulta eficiente. · Solteiro mais rápido alternativo -Passificar a indexação. · Várias técnicas de stemming suportadas, incluindo o Snowball Stemmer para os idiomas europeus.Retieval: · Fornece instalações de consulta padrão, bem como expansão de consulta (feedback de pseudo-relevância) · Pode ser aplicado em aplicações interativas, como o desktop incluído Pesquise, ou em uma configuração em lote para pesquisa e experimentação. · Fornece muitos modelos de ponderação de documentos padrão, incluindo até 126 modelos de ranking de documentos aleatoriamente (DFR) e outros modelos como OKAPI BM25, Modelagem de Idiomas e TF-IDF. O novo modelo de ponderação DFRE DFRe também está incluído, que fornece desempenho robusto em uma variedade de coleções de teste sem a necessidade de qualquer tração ou treinamento de parâmetros. · Júnior de consulta avançada que suporta operadores booleanos, +/- operadores, frase e busca de proximidade, e Campos. · Fornece uma série de modelos de ponderação de termo DFR sem parâmetros para expansão automática de consulta, além da expansão da consulta da Rocchio. · Processamento flexível de termos através de um pipeline de componentes, como removedores de palavras de parada e stemmers.Experimentação: · Handles Todas as coleções de teste TREC atualmente disponíveis - Consulte Exemplos de Experimentação da TREC para exemplos e configurações conhecidas. · Facilmente scriptable para avaliar muitas configurações de parâmetros, ou muitos modelos de ponderação em forma de lote. · Ferramentas de avaliação embutidas para uso com TREC ad-hoc e conhecido Os resultados de recuperação de pesquisa de itens, para produzir várias medidas de precisão e recuperação.Note: Terrier é liberado sob a licença pública de Mozilla.


Terrier. Software Relacionado

Perlpad.

Perlpad oferece execução de código Perl como um serviço de sistema MacOS X ...

149 509 KB

Download

Importado

Importal - Desenvolvimento fácil e rápido de aplicativos que fornecem acesso ao vivo e onipresente ao conteúdo usando XMPP ...

166 10 KB

Download