O projeto de lêmure

Modelagem de linguagem e aplicação de recuperação de informações
Baixe Agora

O projeto de lêmure Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Freeware
  • Preço:
  • FREE
  • Nome do editor:
  • The Lemur Team
  • Site do editor:
  • http://www.lemurproject.org/
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 63.6 MB

O projeto de lêmure Tag


O projeto de lêmure Descrição

Modelagem de linguagem e aplicação de recuperação de informações O Lemur Toolkit é um aplicativo gratuito e de código aberto projetado para facilitar pesquisas em modelagem de linguagem e recuperação de informações. O Lemur Toolkit inclui tecnologias como ad hoc e recuperação distribuída, IR, resumimento, filtragem e classificação. Aqui estão algumas características importantes do "Projeto Lemur": · Idiomas de consulta estruturadas sofisticadas (usando inquérito e INDRI) · Suporte para XML e Recuperação de Documentos Estruturados · Usado comumente com uma ampla gama de coleções de teste de pesquisa (por exemplo, TREC CDS 1-5, WT10G, RCV1, Gov, Gov2) · Indegue suas páginas da Web com uma capacidade de pesquisa de site "fora da caixa" · Interactivas Interactivas para Windows, Linux e Web · Recuperação de informações distribuídas e aplicativos de clustering de documentos · Código cruzado, rápido e modular escrito em C ++ · C ++, java e c # apis · Software livre e de código aberto · Em uso há mais de 6 anos por uma grande e crescente comunidade de usuários Indexação: · Múltiplos métodos de indexação para coleções de pequena, média e larga escala (terabyte) · Suporte integrado para texto inglês, chinês e árabe · Porter e Krovetz palavra stemming · Indexação incremental · Suporte de indexação de caixa para a TREC Text, TREC WEB, texto simples, HTML, XML, PDF, MBOX, Microsoft Word e Microsoft PowerPoint · Índices Inline e compensar anotações de texto (por exemplo, parte de fala e entidades nomeadas) · Índices Atributos do Documento Recuperação: · Suporta grandes abordagens de modelagem de linguagem, como Indri e KL-Divergence, bem como espaço vetorial, TF.IDF, Okapi e inquérito · Relevância e pseudo-relevância Feedback · Expansão do termo curinga (usando INDRI) · Passagem e recuperação do elemento XML · Recuperação Cross-lingual · Suavização via dirichlet Priors e Markov Correntes · Suporta Priores de documentos arbitrários (por exemplo, classificação de página, profundidade de URL) O que há de novo nesta versão: · 2799440 Terminfo retornado por indriterminfolista não tem posições · 2794361 Harvestlinks não criam diretórios de colheita · 2788507 KrovetzstemMertransformation pode transbordar um buffer · 2788504 AnchaRapexAntator pode transbordar um tampão · 2787935 Core de despejos PageRank Se o caminho dos links é ruim · 2784994 Artigo errado · 2783665 TextTokenizer termina prematuramente atributos de tag citados · 2782954 INDRI :: PARSE :: HTMLParser :: Handletag pode transbordar um buffer · 2772914 IRevalgui.jar dá resultados malucos · 2772846 bin / ireval.jar é um arquivo .jar inválido (lemur v48) · 2770916 Corrupção de buffer de documento com vários segmentos · 2747981 WarcDocumentiterator perde documentos no arquivo de warcc · 2747707 TextTokenizer não reconhece alguns atributos de tag coted


O projeto de lêmure Software Relacionado

Qtada.

Uma ligação de linguagem ADA2005 para as bibliotecas QT C ++ e ferramentas associadas ...

239 2.5 MB

Download