stemming.

Implementações Python de vários algoritmos de stemming
Baixe Agora

stemming. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Public Domain
  • Preço:
  • FREE
  • Nome do editor:
  • Matt Chaput
  • Site do editor:
  • http://whoosh.ca

stemming. Tag


stemming. Descrição

Implementações de Python de vários algoritmos de stemming Stemming é uma implementação de Python do Porter, Paice-Husk, Porter2 e Lovins Stemming Algoritmos para Inglês. Essas implementações são diretas e eficientes, ao contrário de algumas versões Python dos mesmos algoritmos disponíveis na web. Este pacote é uma extração do código de stemming incluído no mecanismo de pesquisa Whoosh.Nota que estas são implementações pimentas pimentas. Python Wrappers para, por exemplo, Os summers de Snoball e a implementação C do Stemmer de Porter estão disponíveis no PYPI e serão mais rápidos se o uso de código compilado é uma opção para você.Temming Algorithms tentam remover automaticamente sufixos (e em alguns prefixos de casos), a fim de encontrar a "raiz palavra "ou caule de uma determinada palavra. Isso é útil em vários cenários de processamento de linguagem natural, como search.in General Porter2 é o melhor algoritmo de stemming geral, mas não necessariamente o pacote mais rápido ou mais agressivo. O pacote de stemming contém módulos para cada algoritmo (Lovins, Paquehusk, Porter e Porter2 ). Cada módulo contém uma função de caule (): >> do stemming.Porter2 Stem Stem >> STEM ("faccionalmente") Facção (o algoritmo de Paice-Husk permite conjuntos de regras de stemming personalizados, para que o módulo Paicehusk também inclua uma classe Paicehuskstemmer que você pode instanciar Com regras personalizadas.) O código-fonte desse pacote está disponível no Bitbucket: http: //bitbucket.org/mchaput/stemmingplease Use BitBucket para arquivar relatórios de bugs ou solicitações de recursos: http: //bitbucket.org/mchaput/stemming/issues Requisitos: · Pitão


stemming. Software Relacionado

Squawk.

ferramenta de consulta SQL e biblioteca para arquivos estáticos ...

154

Download