microssarch

uma pequena biblioteca de pesquisa
Baixe Agora

microssarch Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • BSD License
  • Preço:
  • FREE
  • Nome do editor:
  • Daniel Lindsley
  • Site do editor:
  • http://toastdriven com

microssarch Tag


microssarch Descrição

microSearch é uma pequena biblioteca de pesquisa python.Primardieariamente destinado a ser uma ferramenta de aprendizado para ensinar os fundamentos da pesquisa.Useful para incorporar em aplicativos python onde você não quer / precisa de algo tão complexo quanto lucene.part do meu (próximo) 2012 Pycon Discussão - https://us.pycon.org/2012/schedule/presentation/66/usageExample:Import MSEUTHROM # Crie uma instância, apontando para onde os dados devem ser armazenados.ms = microSearch.microsearch ('/ tmp / microSearch ') # Index alguns data.ms.index (' e-mail_1 ', {' texto ': "Peter, \ n \ n \ n \ ni'm indo para precisar desses relatórios do TPS na minha mesa primeiro amanhã! E limpe sua mesa! \ N \ Nlumbergh "}) Ms.Index ('e-mail_2', {'Texto': 'Todo mundo, \ n \ nm-mmm-meu grampeador vermelho ficou ausente. HH-tem um-um-um-um-um-alguém visto? \ n \ nmilton '}) Ms.Index (' e-mail_3 ', {' Texto ': "Peter, \ N \ Nyeah, vou precisar que você entre no sábado. Não esqueça esses relatórios. \ N \ Nlumbergh"} ) ms.index ('e-mail_4', {'Texto': 'Como você se sente em tornar-se gerenciamento? \ n \ n \ nhe bobs'}) # pesquisa no it.ms.search ('Peter') Ms.Search ('Relatório TPS') BRILCONTSTHIS biblioteca é para ajudar os outros a aprender. Embora tenha cobertura total de teste, pode não ser adequado para uso de produção. Razões que você não pode querer usá-lo em código real: - Nenhum suporte de simultaneidade tenta funcionar atomicamente com arquivos, mas não há bloqueios, por isso é possível escrever sobre os processos - talvez segmento-seguro? Praticamente tudo está em uma instância, mas eu não testei extensivamente com threading - sem suporte para excluir documentos se um documento existente mudar ou obter dados excluídos, os dados obsoletos serão deixados no índice uma solução alternativa estaria soprando o diretório de índice, Movendo os documentos e a reinduxá-los: / - Somente n-gramas são suportados porque escrever um porteiro completo ou summer de bola de neve está além das necessidades desta biblioteca - sem pista no desempenho em escala, esta é uma ferramenta de prova de conceito e aprendizado, Não Lucene! Com um MBP de 2011 no primeiro 1.2K Docs do Enron Corpus: - A indexação é bastante lenta em ~ 1 Documento por segunda pesquisa é bastante rápida em ~ 0,007 seg por consulta nunca excedeu 15MB ao indexação, 10MB ao pesquisar No repo de origem como enron_bench.py.running testwith um checkout de origem, execute: em python 2: python -m Unittest2 testsin python 3: python -m Unittest teststests deve estar passando em todos os momentos em ambos os python 2.7 e python 3.2.product's homepage


microssarch Software Relacionado

jsonrpclib-ned14.

Este projeto é uma implementação da especificação JSON-RPC V2.0 (compatível com verso) como cliente ... ...

85

Download

zc.z3monitor

Uma interface de linha de comando acessível em rede para monitorar um processo do Zope 3 ...

227

Download