Lingua :: stopwords.

Parar palavras para vários idiomas
Baixe Agora

Lingua :: stopwords. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Perl Artistic License
  • Preço:
  • FREE
  • Nome do editor:
  • Marvin Humphrey
  • Site do editor:
  • http://search.cpan.org/~creamyg/KinoSearch-0.162/lib/KinoSearch/Search/SearchServer.pm

Lingua :: stopwords. Tag


Lingua :: stopwords. Descrição

palavras de parada para várias línguas Lingua :: Palavras de interrupção é um módulo Perl com palavras de parada para vários utilize languages.SYNOPSIS Lingua :: Stopwords qw (getStopWords); meus $ stopwords = getStopWords ( 'en'); meus @words = qw (eu sou a morsa goo goo g'joob); # Imprime "walrus goo goo g'joob" print juntar '', grep - @words; Em busca de palavras-chave, é prática comum para suprimir uma coleção de "stopwords" {$ stopwords> {$ _}!}: Palavras como "a", "e", "talvez", etc. que existem em um grande número de documentos e não lhe dizem alguma coisa importante sobre qualquer documento que os contém. Este módulo fornece tais "stoplists" em vários languages.Supported Idiomas | ------------------------------------ ----------------------- | | idioma | Código ISO | codificação padrão | Também disponível | | ------------------------------------------------- ---------- | | Dinamarquês | da | ISO-8859-1 | UTF-8 | | Holandês | nl | ISO-8859-1 | UTF-8 | | Inglês | en | ISO-8859-1 | UTF-8 | | finlandês | fi | ISO-8859-1 | UTF-8 | | Francês | fr | ISO-8859-1 | UTF-8 | | German | de | ISO-8859-1 | UTF-8 | | húngaro | hu | ISO-8859-1 | UTF-8 | | Italiano | -lo | ISO-8859-1 | UTF-8 | | norueguês | nenhum | ISO-8859-1 | UTF-8 | | português | pt | ISO-8859-1 | UTF-8 | | Espanhol | es | ISO-8859-1 | UTF-8 | | Swedish | sv | ISO-8859-1 | UTF-8 | | Russian | ru | KOI8-R | UTF-8 | | ------------------------------------------------- ---------- | Requisitos: · Perl.


Lingua :: stopwords. Software Relacionado