Cleartk.

Um kit de ferramentas para desenvolver componentes estatísticos de processamento de linguagem natural em Java
Baixe Agora

Cleartk. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • BSD
  • Preço:
  • FREE
  • Nome do editor:
  • ClearTK Team
  • Site do editor:
  • http://code.google.com/p/cleartk/
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 435 KB

Cleartk. Tag


Cleartk. Descrição

Um kit de ferramentas para desenvolver componentes estatísticos de processamento de linguagem natural em Java O ClearTk Toolkit é baseado no Apache Uima Framework for Text Analysis.CLeartk é um projeto desenvolvido no Centro de Linguagem Computacional e Investigação de Educação (claro) na Universidade do Colorado em Boulder. Em suma, a Cleartk fornece uma estrutura para o desenvolvimento de componentes estatísticos de processamento de linguagem natural (NLP) em Java e fornece duas bibliotecas: Cleartk-Framework e ClearTk-Toolkit que são resumidos brevemente abaixo. Framework: A estrutura Cleartk fornece infraestrutura para o desenvolvimento de Uima Motores de análise que usam aprendizagem estatística como base para criação de tomada de decisões e anotação. O ClearTK Framework fornece o seguinte: · Uma biblioteca de extração de recursos ricos · Uma interface comum e invólucros para bibliotecas de aprendizado de máquina populares com base em modelos, como entropia máxima, suporte máquinas vetoriais e campos aleatórios condicionais. Atualmente suporta libsvm, opennlp maxent, classificadores de malha, campos aleatórios condicionais de malho, svmlight. A abordagem de desenvolvedores permite que se use uma abordagem melhor da raça, permitindo que alguém troque uma biblioteca de aprendizado de máquina para outra de forma que o código que implementa a lógica do núcleo do motor de análise não precisa ser alterado. · O aplicativo fornece uma abordagem agnóstica do sistema. A estrutura do Cleartk não depende ou fornece qualquer sistema de tipo específico. O código fornecido pela estrutura destina-se a ser usado como base para criar novos mecanismos de análise em seu ambiente, de modo que você possa criar componentes específicos de suas necessidades e sistema de tipos. · A estrutura pode ser baixada da página de downloads, verificada do repositório do Subversion como um projeto Eclipse, ou adicionado como uma dependência do Maven se você usar o Maven para criar seu projeto (veja abaixo). CLeartk Toolkit: O ClearTK Toolkit fornece aos componentes do Uima e / ou infraestrutura para lidar com tarefas específicas. O Toolkit fornece o seguinte: · Leitores de coleta para corpora comumente usados (por exemplo, Conl, Ace, PenntreeBank, Genia, Timeml) · Infraestrutura para criar componentes de PNL para tarefas específicas, como a marca de fonoaudiologia, bio-style chunking, entidade Reconhecimento, analisação sintática, rotulagem de função semântica, resolução temporal, etc. · Wrappers para componentes comuns de PNL, como os componentes do Snowball Stemmer e OpenNLP. · O ClearTk Toolkit fornece um sistema de tipos e muitos dos componentes (e testes unitários) dependem deste sistema de tipo. No entanto, trabalhamos duro para fazer muito do código no sistema de tipo de toolkit agnóstico, parametrizando componentes por tipos ou fazendo componentes extensíveis por meio de digitação genérica. · O kit de ferramentas está atualmente disponível apenas como um projeto ECLISPE que pode ser verificado a partir dos requisitos do repositório do Subversion: · Java.


Cleartk. Software Relacionado

Crux.

Um quadro da Web para desenvolvimento de programas em Java ...

150 18 MB

Download

Jbalboa.

ferramenta de desenvolvimento Java de código aberto para desenvolvedores trabalhando em projetos de médio a grande ...

150 1.4 MB

Download

Classmock.

Uma estrutura que ajuda você com a criação da unidade de teste para componentes que usam reflexão ou anotações ...

156 961 KB

Download