| Lingua :: Zh :: Wordseterer Lingua :: Zh :: Wordse Reexam é um módulo Perl que oferece uma segmentação de palavras chinesa simplificada. |
Baixe Agora |
Lingua :: Zh :: Wordseterer Classificação e resumo
- Licença:
- Perl Artistic License
- Nome do editor:
- Zhang Jun
- Site do editor:
- http://search.cpan.org/~jzhang/Lingua-ZH-WordSegmenter-0.01/lib/Lingua/ZH/WordSegmenter.pm
Lingua :: Zh :: Wordseterer Tag
Lingua :: Zh :: Wordseterer Descrição
LINGUA :: ZH :: Wordse Reexam é um módulo Perl que oferece uma segmentação simplificada de palavras chinesas. Lingua :: ZH :: Wordse Signaler é um módulo Perl que oferece uma segmentação de palavra chinesa simplificada.Synopsis usa lingua :: ZH :: Wordse Reexam; Meu $ segmenter = Lingua :: Zh :: Wordse Signaler-> Novo (); codificar codificar ('gbk', $ segmenter-> seg ($ _)); esta é uma versão Perl da segmentação de palavras chinesas simplificadas. O algoritmo para este segmenter é procurar a palavra mais longa em cada ponto de direções esquerda e direita, e escolha aquele com produto de maior frequência.O programa original é da lingua do módulo CPAN :: Zh :: WordseSment (http://search.cpan.org/~chenyr/) Eu fiz as alterações de Follwing: 1) Faça a interface Orientado a Objeto; 2) Faça a cadeia interna em UTF8; 3) Usando o dicionário de Sogou (http://www.sogou.com/labs/dl/w.html) como o dicionário padrão. Requisitos: · Perl.
Lingua :: Zh :: Wordseterer Software Relacionado