Ellogon.

Ellogon é um ambiente de engenharia de linguagem multi-lingual, multi-lingual de propósito geral
Baixe Agora

Ellogon. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • GPL
  • Nome do editor:
  • Georgios Petasis
  • Sistemas operacionais:
  • Windows All
  • Tamanho do arquivo:
  • 10.6 MB

Ellogon. Tag


Ellogon. Descrição

O ellogon é um ambiente de engenharia de linguagem de plataforma cruzada, multi-lingual, desenvolvido para ajudar ambos os pesquisadores que estão fazendo pesquisas em linguística computacional, bem como empresas que produzem e entregam a engenharia de linguagem Ellogon como uma plataforma de engenharia de idiomas oferece um extenso conjunto de instalações, incluindo ferramentas para processamento e visualização de dados textuais / html / XML e informações linguísticas associadas, suporte a recursos lexicais (como criar e incorporar léxicos), ferramentas para criar corpora anotadas, acessando bancos de dados comparando dados anotados ou transformando informações linguísticas em vetores para uso com vários algoritmos de aprendizado de máquina. Durante a última década, um grande número de infraestruturas de software visando facilitar a RD no campo do processamento de linguagem natural foram apresentados. Algumas dessas infraestruturas, como ferramentas ou portão LT-NSL / LT-XML, tornaram-se extremamente populares, pois foram aplicadas a uma ampla gama de tarefas por muitas instituições em todo o mundo. OLLOGON pertence à categoria de plataformas baseadas em referencial ou anotação, onde as informações lingüísticas são armazenadas separadamente dos dados textuais, tendo referências de volta ao texto original. Com base no modelo de dados Tipster, o Ellogon fornece infraestrutura para: · Gerenciando, armazenando e trocando dados textuais, bem como as informações lingüísticas associadas. · Criar, incorporar e gerenciar componentes de processamento linguístico. · Facilitar a comunicação entre diferentes componentes linguísticos definindo uma interface de programação adequada (API). · Visualizar dados textuais e informações lingüísticas associadas. OLLOGON compartilha o mesmo modelo de dados que a arquitetura informática. Devido a isso, compartilha alguns recursos básicos com outras infraestruturas baseadas em tipster, como portão. No entanto, também oferece um grande número de recursos que a diferenciam dessas infraestruturas. O elemento central para armazenar dados no Ellogon é a coleção. Uma coleção é um conjunto finito de documentos. Um documento de ellogon consiste em dados textuais, bem como informações linguísticas sobre os dados textuais. Esta informação linguística é armazenada na forma de atributos e anotações. Um atributo associa um tipo específico de informações com um valor digitado. Uma anotação associa informações arbitrárias (na forma de atributos) com partes de dados textuais. Cada uma parte, nomeada em nome, consiste em duas offsets de caracteres denotando o início e os caracteres finais da parte, conforme medido a partir do primeiro caractere de alguns dados textuais. Anotações geralmente consistem em quatro elementos: · Um identificador numérico. Esse identificador é único para cada anotação dentro de um documento e pode ser usado para identificar inequivocamente a anotação. · Um tipo. Os tipos de anotação são valores textuais que são usados para classificar anotações em categorias. · Um conjunto de vãos que denotam o intervalo dos dados textuais anotados. · Um conjunto de atributos. Esses atributos geralmente codificam as informações lingüísticas necessárias. O ellogon em sua forma atual satisfaz todos esses requisitos. Como o Ellogon é baseado na arquitetura de informática, ele compartilha muitas propriedades básicas com outras infraestruturas baseadas em tipser, como o portão. No entanto, Ellogon oferece várias características importantes que a diferenciam de infraestruturas semelhantes: · Easy Component Development É bastante fácil entender o processo de desenvolvimento de novos componentes e desenvolvê-los usando as funcionalidades fornecidas pela Ellogon. Além disso, uma ampla gama de linguagens de programação para o desenvolvimento de componentes são suportadas, incluindo C, C ++, Java, TCL, Perl e Python. · ambiente integrado de desenvolvimento O ellogon opera como um ambiente de desenvolvimento integrado, pois fornece suporte completo ao ciclo de desenvolvimento de um componente. Os componentes podem ser criados, editados, compilados e vinculados (se aplicável) de Ellogon. Além disso, os componentes C / C ++ / Java podem ser descarregados, modificados, compilados e recarregados em elogon sem ter que desistir de ellogon. A capacidade de descarregar ou recarregar todos os componentes é essencial, pois pode reduzir significativamente o ciclo de desenvolvimento, uma vez que as modificações do componente podem ser imediatamente avaliadas. · um componente pronto para usar "Toolbox" O Ellogo está equipado com um grande número de ferramentas prontas para uso para executar tarefas, como criação anotada de corpora, geração de vetores ou comparação de dados. Além disso, vários componentes de amostra são fornecidos que podem ser adaptados a vários domínios e idiomas, que realizam algumas tarefas básicas, como o tokenization, a marcação de parte da fala ou a pesquisa da Lista de Gazetteer. Finalmente, Ellogon oferece várias ferramentas de visualização de dados, desde os espectadores simples para o banco de dados de anotação aos espectadores capazes de exibir informações hierárquicas, como árvores de sintaxe. · Implantação fácil Como Ellogon implementa uma arquitetura decompositável, é extremamente fácil criar um produto fácil de usar de um conjunto de componentes que realizam uma tarefa específica. Todos os componentes, juntamente com as peças de ellogon necessárias, podem ser empacotadas em um único executável (que não precisa de instalação) ou como um aplicativo (que pode ser executado não modificado em sistemas múltiplo). Esses aplicativos especializados podem ser distribuídos e usados em qualquer sistema, mesmo que o Ellogon não tenha sido instalado no sistema. Requisitos: · TCL / TK 8.4 (ou mais recente), · Java JDK / JRE 1.4.1 (opcional), · Perl 5.8.1 (opcional), · Python 2.2 (opcional).


Ellogon. Software Relacionado