Poliqarp.

Poliqarp é um utilitário para pesquisar grandes corporações.
Baixe Agora

Poliqarp. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • GPL
  • Preço:
  • FREE
  • Nome do editor:
  • Daniel Janus
  • Site do editor:

Poliqarp. Tag


Poliqarp. Descrição

Poliqarp é um utilitário para pesquisar grandes corporações. Poliqarp é um utilitário para pesquisar grandes corporações. Aqui estão algumas características principais de "poliqarp": Suporte para tagged corpora: · A coleção pesquisada pode conter não apenas o texto bruto, mas também informações sobre as palavras e textos que constituem (formas gramaticais de palavras; estrutura dos textos; várias meta-informações sobre os textos como a autoria e a data de escrita). Linguagem de consulta expressiva: A linguagem de consulta da Poliqarp é baseada em expressões regulares e permite que você pesquise não apenas por uma determinada palavra ou seqüências de palavras, mas também, por exemplo, para: · Um adjetivo seguido por um substantivo · Cinco substantivos seguidos · Cinco, seis ou sete substantivos em uma fileira · Uma determinada palavra que ocorre perto, mas não necessariamente a seguir, para outra palavra dada · Palavras que começam com 'Z' que ocorrem em textos publicados no século XIX · Frases mais de 100 palavras · ...e muitos mais Suporte para tags de posicionais: · As tags atribuídas às palavras podem ter uma estrutura interna, e essa estrutura pode ser incorporada em consultas. Por exemplo, os substantivos podem ter gênero, número ou caso, os verbos podem ter aspecto e assim por diante. · Isto é especialmente útil com idiomas que são ricos em inflexão, como polonês (na verdade, a poliqarp foi originalmente desenvolvida e é usada dentro de um projeto polonês de corpus - o Pan Corpus do IPI). · Não depende de um tagset específico · Suporte para Unicode · Você pode criar corpora de textos escritos em quase qualquer idioma em seu script nativo - ser inglês, polonês, japonês ou tailandês - desde que sejam codificados no formato UTF-8. Suporte para ambiguidades: · As tags de uma palavra não são necessariamente únicas: pode ocorrer situações em que uma palavra pode ser interpretada de várias maneiras (e, portanto, ter várias tags atribuídas a ele). A Poliqarp pode lidar com essas situações e permite que você diga se sua consulta deve corresponder a qualquer uma das possíveis interpretações ou todas elas. Poucos, se houver, outros concordanceiros têm essa habilidade. Multi plataforma: · A poliqarp é escrita em Java e portátil C, e está disponível, portanto, para sistemas de Windows e a maioria dos sistemas semelhantes a UNIX, incluindo Linux, * BSD e Solaris. Atualmente, suporta apenas arquiteturas pequenas e endianas, mas o trabalho está em andamento para torná-lo endian-neutro. Eficiente: · É difícil estimar o tempo médio de procurar um corpus, já que depende fortemente da estrutura da consulta. No entanto, uma palavra simples (para uma palavra ou frase) leva alguns segundos mesmo em corpora contendo mais de cem milhões de palavras (em termos de textos crus, isso são vários gigabytes, incluindo tags e metadados!) A consulta mais complexa leva mais tempo para executar, mas Mesmo assim, você obtém os resultados assim que são encontrados, então você não precisa esperar muito. Livre: · Poliqarp é software livre / open source, disponível sob os termos da Licença Pública Geral GNU. Requisitos: · Java 2 Edição Standard Runtime Ambiente O que há de novo nesta versão: · Uma grande regressão na BPugprade, que poderia levar à perda de dados, foi corrigida.


Poliqarp. Software Relacionado

Openephyra.

O OpenPhyra é uma estrutura modular e extensível para resposta a perguntas de domínio aberto (QA). ...

483

Download

metaf2xml.

Analias Metaf2xml e decodifica as mensagens METAR e TAF e as armazena como XML. ...

122

Download

pdftex.

Uma versão estendida do TEX que pode criar PDF diretamente dos arquivos de origem do TEX ...

184

Download