| Toolkit de linguagem natural Toolkit de idioma natural é uma suíte de bibliotecas e programas de Python para processamento de linguagem natural simbólica e estatística. |
Baixe Agora |
Toolkit de linguagem natural Classificação e resumo
- Nome do editor:
- Steven Bird
Toolkit de linguagem natural Tag
Toolkit de linguagem natural Descrição
Kit de Linguagem Natural é uma suíte de bibliotecas e programas de Python para processamento de linguagem natural simbólica e estatística. Kit de Linguagem Natural é uma suíte de bibliotecas e programas de Python para processamento de linguagem natural simbólica e estatística. A NLTK inclui demonstrações gráficas e dados de amostra. É acompanhado por extensa documentação, incluindo tutoriais que explicam os conceitos subjacentes por trás das tarefas de processamento de idiomas suportadas pelo Toolkit.Documentation: Uma quantidade substancial de documentação sobre como usar o NLTK Home está disponível na NLTK Home Página: Em particular, a página inicial do NLTK contém três tipos de documentação: · Tutoriais ensinam aos alunos a usar o kit de ferramentas, no contexto de executar tarefas específicas. Eles são apropriados para quem deseja aprender a usar o kit de ferramentas. · A documentação de referência da ferramenta descreve todos os módulos, interface, classe, método, função e variável no kit de ferramentas. Esta documentação deve ser útil para os usuários e desenvolvedores. · Um número de relatórios técnicos está disponível. Esses relatórios explicam e justificam o projeto e a implementação do Kit Toolkit. Eles são usados pelos desenvolvedores do Toolkit para orientar e documentar a construção da Kit Toolkit. Os alunos podem consultar esses relatórios se eles gostariam de mais informações sobre como o kit de ferramentas é projetado e por que ele é projetado dessa maneira. O que há de novo nesta versão: NLTK: - Pacote de semântica expandido para lógica de primeira ordem, lógica linear, semântica de cola, DRT, LFG (Dan Garrette) - Nova classe de wordnet .Syncset Apoiar o acesso a silhas de chaves de sentido e acessar contagens de sentido (Joel Nothman) - Interface para a implementação de CRF da cadeia linear de Malet (NLTK.Tag.crf) - Misc BugFixes Inclusão, Sincas, Maxent - Melhor suporte para corpus de pedaços flexíveis Leitor, novo tipo de regra: ChunkrulewithContext- Nova GUI para concordanciamento POS-Tagged NLTK.DRAW.POS_CONCORDANCE- Nova GUI para o desenvolvimento de chunkers regexp NLTK.DRAW.RECHUNKPARSER - Adicionado bio_sents () e bio_words () métodos para conllchunkcorpusReader em conll.py para permitir Leitura (palavra, tag, chunk_typ) Tuples off of Conll-2000 Corpus. Também modificou ConllChunkCorpusView para suportar essas alterações .- Estruturas de recursos de suporte Valores com métodos de unificação personalizados - Novo sinalizador em leitores corpus marcados para usar tagsets simplificados - novo pacote para a modelagem de linguagem NGRAM com a classes de backoff do Katz Backoff NLTK.Model- Árvores planejadas que mantêm automaticamente os ponteiros dos pais (NLTK.Tree.ParentedTree e NLTK.Tree.MultiparentedTree) - New WordNet Browser GUI (Jussi Salmela, Paul Bone) - Melhor suporte para seqüências preguiçosas - Método gerado () para distribuições de probabilidade Analia flexível para a conversão de cordas entre colchetes a árvores - Facilitadas para os docstrings para melhorar a documentação da APIContrib (trabalho em andamento) - Novo pacote NLG, FUF / Surge (Petro Verkhogliad) - Novo pacote de parser de dependência (Jason Narad) - Novo pacote de coreference Para ACE-2, MUC-6 e MUC-7 Corpora (Joseph Frazee) - Parser CCG (Graeme Gange) - Resolução de primeira ordem Provador de Teorema (Dan Garrette) Dados: - NNW NPS Chat Corpus A Nd Corpus Reader (NLTK.CORPUS.NPS_CHAT) - ConllCorPusReader agora pode ser usado para ler Conl 2004 e 2005 Corpora.- Implantado TreeBank Pos Baseado em HMM Pos Tagger e Chunker para NLTK_CONTRIB.COREF em api.py. Versões em conserva desses objetos são verificadas em dados / taggers e dados / chunkers.book: - Misc Correções em resposta ao feedback dos leitores O que há de novo nesta versão: · Esta versão finaliza a API da NLTK antes da versão 2.0 e a publicação do livro NLTK. Houve dezenas de pequenos aprimoramentos e correções de bugs. Muitos nomes do formulário NLTK.FOO.BAR estão agora disponíveis como NLTK.BAR. Existe funcionalidade expandida na árvore de decisão, colocações e módulos de caixa de ferramentas. Um novo brinquedo de tradução NLTK.MISC.BABELFish foi adicionado. Um novo módulo NLTK.HELP fornece acesso à documentação do TAGSET. Importações fixas para que o NLTK construirá e instale sem Tinter (para execução em servidores). Novos dados incluem um modelo máximo de efeitos de entropia e gramáticas atualizadas. O NLTK Contrib inclui atualizações para o pacote de coreference (Joseph Frazee) e o Isri Árabe Stemmer (Hosam Algasaier). O livro foi submetido a correções editoriais substanciais antes da publicação final.
Toolkit de linguagem natural Software Relacionado