| Lingua :: stopwords. Parar palavras para vários idiomas |
Baixe Agora |
Lingua :: stopwords. Classificação e resumo
- Licença:
- Perl Artistic License
- Nome do editor:
- Marvin Humphrey
- Site do editor:
- http://search.cpan.org/~creamyg/KinoSearch-0.162/lib/KinoSearch/Search/SearchServer.pm
Lingua :: stopwords. Tag
Lingua :: stopwords. Descrição
palavras de parada para várias línguas Lingua :: Palavras de interrupção é um módulo Perl com palavras de parada para vários utilize languages.SYNOPSIS Lingua :: Stopwords qw (getStopWords); meus $ stopwords = getStopWords ( 'en'); meus @words = qw (eu sou a morsa goo goo g'joob); # Imprime "walrus goo goo g'joob" print juntar '', grep - @words; Em busca de palavras-chave, é prática comum para suprimir uma coleção de "stopwords" {$ stopwords> {$ _}!}: Palavras como "a", "e", "talvez", etc. que existem em um grande número de documentos e não lhe dizem alguma coisa importante sobre qualquer documento que os contém. Este módulo fornece tais "stoplists" em vários languages.Supported Idiomas | ------------------------------------ ----------------------- | | idioma | Código ISO | codificação padrão | Também disponível | | ------------------------------------------------- ---------- | | Dinamarquês | da | ISO-8859-1 | UTF-8 | | Holandês | nl | ISO-8859-1 | UTF-8 | | Inglês | en | ISO-8859-1 | UTF-8 | | finlandês | fi | ISO-8859-1 | UTF-8 | | Francês | fr | ISO-8859-1 | UTF-8 | | German | de | ISO-8859-1 | UTF-8 | | húngaro | hu | ISO-8859-1 | UTF-8 | | Italiano | -lo | ISO-8859-1 | UTF-8 | | norueguês | nenhum | ISO-8859-1 | UTF-8 | | português | pt | ISO-8859-1 | UTF-8 | | Espanhol | es | ISO-8859-1 | UTF-8 | | Swedish | sv | ISO-8859-1 | UTF-8 | | Russian | ru | KOI8-R | UTF-8 | | ------------------------------------------------- ---------- | Requisitos: · Perl.
Lingua :: stopwords. Software Relacionado