Analisador HTML.biblioteca para analisar o conteúdo HTML | |
Baixe Agora |
Analisador HTML. Classificação e resumo
Propaganda
- Licença:
- LGPL
- Preço:
- FREE
- Nome do editor:
- Derrick Oswald
- Site do editor:
- Sistemas operacionais:
- Mac OS X
- Tamanho do arquivo:
- 323 KB
Analisador HTML. Tag
Analisador HTML. Descrição
Biblioteca para analisar o conteúdo HTML O Parser HTML é uma biblioteca Java gratuita e aberta usada para analisar HTML em uma forma linear ou aninhada. Usado principalmente para transformação ou extração, recursos HTML de filtros, visitantes, tags personalizadas e fácil de usar JavaBeans. É um pacote rápido, robusto e bem testado.ExtractionExtraction engloba todos os programas de recuperação de informações que não são destinados a preservar a página de origem. Essas cobranças usam como: · Extração de texto, para uso como entrada para bancos de dados de mecanismo de pesquisa de texto, por exemplo · Extração de links, para rastejar através de páginas da Web ou coleta de e-mail endereçamentoSesssesscreen raspando, para entrada de dados programáticos de páginas da Web · Extração de recursos, coleta de imagens ou som · Uma extremidade frontal do navegador, a exibição preliminar da página · Verificação de links, garantindo que os links são válidos · Monitoramento do site, verificação de diferenças de página para além de diffs simplistas são várias instalações no HTMLParser Codebase para ajudar com a extração, incluindo filtros, visitantes e javebeans. TransformationTransformation inclui todo o processamento onde a entrada e a saída são páginas HTML. Alguns exemplos são: · Reescrevendo URL, modificando alguns ou todos os links em uma página · Captura do site, movendo o conteúdo da Web para o disco local · Censura, removendo palavras ofensivas e frases de páginas · Limpeza HTML, corrigindo páginas erradas · Remoção de anúncios URLs Referenciando publicidade · Conversão para XML, movendo páginas da Web existentes para os requisitos XML: · Java. O que há de novo nesta versão: · O projeto HTMLParser foi atualizado com uma nova licença, novo ambiente de construção, novo repositório e um novo site. Para identificar essa mudança radical, a versão foi revida para 2.0. · Em resposta a solicitações da comunidade Apache, a licença HTMLParser foi alterada da Licenciatura GNU ou menor licença pública geral, para a licença pública comum mais amigável do Apache 1.0 (http://opensource.org/licenses/cpl1.0.txt) . · O repositório HTMLParser foi alterado de CVS para Subversion (http://subversion.tigris.org/). · Para apoiar a integração automática em outros projetos, o ambiente de construção mudou de formiga para Maven 2 (http://maven.apache.org/). Isso forneceu uma oportunidade para atualizar o site (http://htmlparser.org).
Analisador HTML. Software Relacionado
Dbzul.
Biblioteca para a criação de formulários para visualizar e editar tabelas de banco de dados fornecidas ...
61 221 KB