Analisador HTML.

biblioteca para analisar o conteúdo HTML
Baixe Agora

Analisador HTML. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • LGPL
  • Preço:
  • FREE
  • Nome do editor:
  • Derrick Oswald
  • Site do editor:
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 323 KB

Analisador HTML. Tag


Analisador HTML. Descrição

Biblioteca para analisar o conteúdo HTML O Parser HTML é uma biblioteca Java gratuita e aberta usada para analisar HTML em uma forma linear ou aninhada. Usado principalmente para transformação ou extração, recursos HTML de filtros, visitantes, tags personalizadas e fácil de usar JavaBeans. É um pacote rápido, robusto e bem testado.ExtractionExtraction engloba todos os programas de recuperação de informações que não são destinados a preservar a página de origem. Essas cobranças usam como: · Extração de texto, para uso como entrada para bancos de dados de mecanismo de pesquisa de texto, por exemplo · Extração de links, para rastejar através de páginas da Web ou coleta de e-mail endereçamentoSesssesscreen raspando, para entrada de dados programáticos de páginas da Web · Extração de recursos, coleta de imagens ou som · Uma extremidade frontal do navegador, a exibição preliminar da página · Verificação de links, garantindo que os links são válidos · Monitoramento do site, verificação de diferenças de página para além de diffs simplistas são várias instalações no HTMLParser Codebase para ajudar com a extração, incluindo filtros, visitantes e javebeans. TransformationTransformation inclui todo o processamento onde a entrada e a saída são páginas HTML. Alguns exemplos são: · Reescrevendo URL, modificando alguns ou todos os links em uma página · Captura do site, movendo o conteúdo da Web para o disco local · Censura, removendo palavras ofensivas e frases de páginas · Limpeza HTML, corrigindo páginas erradas · Remoção de anúncios URLs Referenciando publicidade · Conversão para XML, movendo páginas da Web existentes para os requisitos XML: · Java. O que há de novo nesta versão: · O projeto HTMLParser foi atualizado com uma nova licença, novo ambiente de construção, novo repositório e um novo site. Para identificar essa mudança radical, a versão foi revida para 2.0. · Em resposta a solicitações da comunidade Apache, a licença HTMLParser foi alterada da Licenciatura GNU ou menor licença pública geral, para a licença pública comum mais amigável do Apache 1.0 (http://opensource.org/licenses/cpl1.0.txt) . · O repositório HTMLParser foi alterado de CVS para Subversion (http://subversion.tigris.org/). · Para apoiar a integração automática em outros projetos, o ambiente de construção mudou de formiga para Maven 2 (http://maven.apache.org/). Isso forneceu uma oportunidade para atualizar o site (http://htmlparser.org).


Analisador HTML. Software Relacionado

Skandium.

Biblioteca de esqueleto algorítmico baseado em código aberto e Java ...

323 38 KB

Download

Dbzul.

Biblioteca para a criação de formulários para visualizar e editar tabelas de banco de dados fornecidas ...

61 221 KB

Download