Texto-frase.

uma ferramenta de tokenizer de texto e sentença splitter
Baixe Agora

Texto-frase. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • BSD License
  • Preço:
  • FREE
  • Nome do editor:
  • Robert Lujo
  • Site do editor:
  • http://bitbucket.org/trebor74hr/

Texto-frase. Tag


Texto-frase. Descrição

Um tokenizer de texto e ferramenta de divisor de sentença A frase de texto é um tokenizer de texto e a biblioteca Splitter Splitter.Input é para a função principal é o texto, lista de nomes e abreviaturas conhecidos. Resultado é a lista de tokens. Cada token tem um tipo e outros atributos, ou seja: * é o número, * é o número, * é o número romano, * é final de sentença, * é abreviatura, * é nome, * é final do capítulo * etc.Determining final de frase precisa lógica especial E se importa qual é o principal motivo para o pacote de nomeação com "texto-frase" .featuressystem é baseado em unicode strings.Check Introdução. Instruções de estalaçãoInstalação - Se você instalou o PIP POBCO http://pypi.python.org/pypi/pip : PIP Install Text-Sentenceif Não, então faça a maneira antiga: * Baixe Zip de http://pypi.python.org/pypi/text-sentence/ * UNZIP * Abrir Shell * Ir para o diretório de distribuição * Configuração do Python. a versão do PY InstallDevelopment Você pode ver em http://bitbucket.org/trebor74hr/text-sentence.or clone mercurial com: hg clone https://bitbucket.org/trebor74hr/text-sentinggetting IniciadoTodo: Uso Exemplo - Comece o Shell Python: >>> De Text_Sentence Import ... Além disso, não há uma boa documentação, a melhor fonte de mais informatio n é lendo testes dentro do módulo e testes test_sentence. Mais informações em testes em execução. Você pode sempre ler uma fonte.DocumentationCurrently não há documentação. Em andamento ... Suporte a este projeto é limitado pelo meu tempo livre, o suporte é limitado.Report Bug ou Solicite feature. Você encontra bug, o melhor é denunciá-lo à página da Web Bitbucket http://bitbucket.org/trebor74hr/text -Sentência. A melhor maneira de entrar em contato comigo é por correio (Licença Find na Licença) .Todo Lista está em Readme.txt (Dev versão) .Contribuções, este projeto não está atualmente na fase de API estável, a contribuição deve esperar por um tempo. TestesTodos testes são médicos (não unittests). Há dois tipos de testes no pacote: 1. Doctestes no módulo IE em __init__.py 2. Módulo de teste no test_sentence.txtrunning diretamente executará 1. e 2.Para executar testes: * diretório goto text_sentence * executar testes executando o módulo , por exemplo:> python __init__.py __main__: executando doctests test_sentence.txt: executando doctests * outro com:> python -m "text_sentence" Requisitos: · Pitão O que há de novo nesta versão: · IS_Contraction token atributo - e. não é ou o?


Texto-frase. Software Relacionado