LINGUA :: PT :: Resumirizar

Uma ferramenta simples para resumir corpos de texto em inglês.
Baixe Agora

LINGUA :: PT :: Resumirizar Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Perl Artistic License
  • Preço:
  • FREE
  • Nome do editor:
  • Dennis Taylor
  • Site do editor:
  • http://www.funkplanet.com/spellcast/

LINGUA :: PT :: Resumirizar Tag


LINGUA :: PT :: Resumirizar Descrição

Uma ferramenta simples para resumir corpos de texto em inglês. Lingua :: PT :: Summarize é uma ferramenta Perl simples para resumir órgãos de texto em inglês.synopsis Use Lingua :: PT :: Resumir; Meu $ resumo = resumir ($ texto); # Fácil, não? :-) Meu $ resumo = resumir ($ text, maxlength => 500); # 500-byte Summary Meu $ resumo = resumir ($ texto, filtro => 'html'); # Tira HTML Formatando meu $ resumo = resumir ($ text, wrap => 75); # Enrole a saída para 75 col.Este é um módulo simples que faz um esforço não científico em resumir o texto em inglês. Ele reconhece padrões simples que parecem declarações, abrigam-os e concatenam-os em algo vagamente parecido com um resumo. Precisa de mais trabalho em grandes corpos de texto, mas parece ter um efeito decente em pequenos insumos no momento .: PT :: Summarize exportações uma função, resumir (), que leva o texto para resumir como seu primeiro argumento e qualquer número de diretivas opcionais no nome => forma de valor. As opções que vão tomar são: MaxLength Especifica o comprimento máximo, em bytes, dos bytes gerados summary.wrap, a saída de resumo, a saída para o número de colunas que você especificar.filter passa o texto através de um filtro antes de entregá-lo para o resumo. Atualmente, apenas dois filtros são implementados: "HTML", que usa HTML :: treebuilder e HTML :: FormatText para despir toda a formatação HTML de um documento e "EasyHTML", que rapidamente (e com menos precisão) tiram todos os HTML de um documento usando uma simples expressão regular, se você não tiver os módulos acima mencionados. Um filtro "E-mail", para converter mensagens de e-mail e notícias para o texto facilmente resumível, está nos trabalhos para a próxima versão.Unlike o módulo HTML :: Resumirize (o que é bastante interessante, e vale uma olhada), este módulo considera Entrada para ser totalmente texto em inglês e não tenta reunir nenhuma informação da formatação. Assim, sem quaisquer sugestões do formato do documento, o esquema de que HTML :: Resumir usos não é aplicável aqui. O esquema atual é algo assim: "Filtre o texto de acordo com a opção do filtro do usuário. Dividir o texto em frases discretas com o módulo de texto :: Sentença, então dividi-los ainda mais em cláusulas em vírgulas e vírgulas. Mantenha apenas os que tenham uma estrutura (objeto muito simples-verbo). Construa o resumo das primeiras frases na lista, permanecendo dentro do limite MaxLength, ou menos de 30% do tamanho do texto original, o que for menor ", desnecessário dizer Este é um esquema muito simples e não muito universalmente eficaz, mas é bom o suficiente para um primeiro rascunho, e vou bater mais tarde. Como eu disse, não é uma abordagem científica do problema, mas é melhor que nada (e muitas vezes melhor que html :: resumir!), E eu realmente não preciso de um. saída de qualidade a partir dele. Requisitos: · Perl.


LINGUA :: PT :: Resumirizar Software Relacionado