| stemming. Implementações Python de vários algoritmos de stemming |
Baixe Agora |
stemming. Classificação e resumo
- Nome do editor:
- Matt Chaput
- Site do editor:
- http://whoosh.ca
stemming. Tag
stemming. Descrição
Implementações de Python de vários algoritmos de stemming Stemming é uma implementação de Python do Porter, Paice-Husk, Porter2 e Lovins Stemming Algoritmos para Inglês. Essas implementações são diretas e eficientes, ao contrário de algumas versões Python dos mesmos algoritmos disponíveis na web. Este pacote é uma extração do código de stemming incluído no mecanismo de pesquisa Whoosh.Nota que estas são implementações pimentas pimentas. Python Wrappers para, por exemplo, Os summers de Snoball e a implementação C do Stemmer de Porter estão disponíveis no PYPI e serão mais rápidos se o uso de código compilado é uma opção para você.Temming Algorithms tentam remover automaticamente sufixos (e em alguns prefixos de casos), a fim de encontrar a "raiz palavra "ou caule de uma determinada palavra. Isso é útil em vários cenários de processamento de linguagem natural, como search.in General Porter2 é o melhor algoritmo de stemming geral, mas não necessariamente o pacote mais rápido ou mais agressivo. O pacote de stemming contém módulos para cada algoritmo (Lovins, Paquehusk, Porter e Porter2 ). Cada módulo contém uma função de caule (): >> do stemming.Porter2 Stem Stem >> STEM ("faccionalmente") Facção (o algoritmo de Paice-Husk permite conjuntos de regras de stemming personalizados, para que o módulo Paicehusk também inclua uma classe Paicehuskstemmer que você pode instanciar Com regras personalizadas.) O código-fonte desse pacote está disponível no Bitbucket: http: //bitbucket.org/mchaput/stemmingplease Use BitBucket para arquivar relatórios de bugs ou solicitações de recursos: http: //bitbucket.org/mchaput/stemming/issues Requisitos: · Pitão
stemming. Software Relacionado