Analisador HTML.

HTML Parser é uma biblioteca Java usada para analisar HTML em uma forma linear ou aninhada.
Baixe Agora

Analisador HTML. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • LGPL
  • Preço:
  • FREE
  • Nome do editor:
  • Derrick Oswald
  • Site do editor:
  • http://htmlparser.org

Analisador HTML. Tag


Analisador HTML. Descrição

O HTML Parser é uma biblioteca Java usada para analisar HTML em uma moda linear ou aninhada. O HTMLParser é um parser em tempo real super-rápido para o HTML do mundo real. O que atraiu a maioria dos desenvolvedores para o HTMLParser tem sido a sua simplicidade em design, velocidade e capacidade de lidar com o streaming do mundo real HTML. Os dois casos de uso fundamental que são tratados pelo analisador são extração e transformação (o caso de uso de sínteses, onde HTML As páginas são criadas a partir do zero, é melhor manipulada por outras ferramentas mais próximas da fonte de dados). Enquanto as versões prévias concentradas na extração de dados das páginas da Web, a versão 1.4 do HTMLParser possui melhorias substanciais na área de transformar páginas da Web, com criação de tag simplificadas e edição de etiqueta e saída do método Verbatim TOHTML (). Para usar o HTMLParser, você precisará para ser capaz de escrever código na linguagem de programação Java. Embora alguns programas de exemplo sejam fornecidos que possam ser úteis à medida que provavelmente você precisará (ou deseja) criar seus próprios programas ou modificar os fornecidos para corresponder ao aplicativo pretendido. Para usar a biblioteca, você precisará Adicione o htmllexer.jar ou o htmlparser.jar ao seu caminho de classe ao compilar e funcionar. O htmllexer.jar fornece acesso de baixo nível a nós genéricos, observação e nós de tag na página de uma maneira linear, plana e seqüencial. O htmlparser.jar, que inclui as classes encontradas no HTMLlexer.jar, fornece acesso a uma página como uma sequência de tags diferenciadas aninhadas contendo string, observação e outros nós de tag. Então, onde a saída das chamadas para o método Lexer NextNode () pode ser: "Bem-vindo" <title/> <head/> <body> etc ... A saída do nódero do analisador faria Aninhe as etiquetas como filhos dos nós, e outros nós (aqui representados por indentação): <html> <head> <title> "Bem-vindo" <title/> <head/> <corpo> etc ... O analisador tenta equilibrar Abrindo tags com tags finais para apresentar a estrutura da página, enquanto o Lexer simplesmente cuspa os nós. Se o seu aplicativo exigir apenas o conhecimento estrutural modesto da página, e é principalmente preocupado com nós individuais, você deve considerar o uso do Lexer Leve. Mas se o seu aplicativo requer conhecimento da estrutura aninhada da página, por exemplo, você provavelmente desejará usar o parser completo.ExtractionExtraction engloba todos os programas de recuperação de informações que não devem preservar a página de origem. Essas tampas usam como: · Extração de texto, para uso como entrada para bancos de dados de mecanismo de pesquisa de texto, por exemplo · Extração de links, para rastejar através de páginas da Web ou coleta de endereços de e-mail · raspagem de tela, para entrada de dados programáticas de páginas da Web · Extração de recursos, coleta de imagens ou SOUNDO · Um front end do navegador, a fase preliminar do display de página · Verificação de links, garantindo links é válida · Monitoramento de sites, verificação de diferenças de página para além de difs simplistas são várias instalações na HTMLParser Codebase para ajudar com a extração, incluindo filtros, visitantes e JavaBeans.TransformationTransformação inclui todo o processamento onde a entrada e a saída são páginas HTML. Alguns exemplos são: · Reescrevendo URL, modificando alguns ou todos os links em uma página · Captura do site, movendo o conteúdo da Web para o disco local · Censura, removendo palavras ofensivas e frases de páginas · Limpeza HTML, corrigindo páginas erradas · Remoção de anúncios URLS Referenciando a publicidade · Conversão para XML, movendo as páginas da Web existentes para XMLDuring ou após a leitura em uma página, as operações nos nós podem realizar muitas tarefas de transformação "no lugar", que podem ser enviadas com o método TOHTML (). Dependendo do propósito de sua inscrição, você provavelmente vai querer olhar para decoradores de nó, visitantes ou tags personalizados em conjunto com o prototypicalnodefactory.O Parser HTML é uma biblioteca de código aberto lançada sob a Licença Pública Geral GNU, que basicamente diz que você é Livre para usar a biblioteca "como está" em outros produtos (mesmo proprietários), desde que o crédito devido seja dado aos autores e o código-fonte do HTMLParser esteja incluído ou disponível com o outro produto. Para uso modificado ou incorporado, consulte a licença LGPL. </p> <div class="clearfix"></div> <br/> <p class="c-title fl"><span> Analisador HTML. Software Relacionado</span></p> <div class="clearfix"></div> </div> <div class="clearfix"></div> <div class="new-post"> <article class="app-list sb clearfix"> <figure class="figure fl"> <a class="thumbnail" href="/Linux/download-MastDiscovery.-10029873.htm"> <img class="img-cover br" src="https://icon.softwaresea.com/48x48/5/64/1031842.a76e369a982fa8e6ec44488979676530.gif"/> </a> </figure> <div class="content fl"> <h2 class="title ellipsis"><a href="/Linux/download-MastDiscovery.-10029873.htm"> MastDiscovery. </a></h2> <p class="intro ellipsis"> MastDiscovery é uma biblioteca Java usada para anunciar e descobrir serviços em uma rede. ...</p> <p class="data clearfix"> <time class="time fl"> <i class="fa fa-calendar"></i>N/A</time> <span class="view fl hidden-sm-md-lg"><i class="fa fa-download"></i>131</span> <span class="view"><i class="fa fa-save"></i></span> </p> </div> <p class="btn fr"><a rel="nofollow" class="download transition br" href="/Linux/download-MastDiscovery.-10029873.htm"><i class="fa fa-download"></i> Download</a></p> </article> <article class="app-list sb clearfix"> <figure class="figure fl"> <a class="thumbnail" href="/Linux/download-XJ3D.-10029883.htm"> <img class="img-cover br" src="https://icon.softwaresea.com/48x48/5/64/1031851.e78b8290865ece976f92efa078704478.gif"/> </a> </figure> <div class="content fl"> <h2 class="title ellipsis"><a href="/Linux/download-XJ3D.-10029883.htm"> XJ3D. </a></h2> <p class="intro ellipsis"> XJ3D é um projeto do consórcio Web3D focado na criação de um kit de ferramentas para o conteúdo VRML97 e X3D escrito completamente em Java. ...</p> <p class="data clearfix"> <time class="time fl"> <i class="fa fa-calendar"></i>N/A</time> <span class="view fl hidden-sm-md-lg"><i class="fa fa-download"></i>250</span> <span class="view"><i class="fa fa-save"></i></span> </p> </div> <p class="btn fr"><a rel="nofollow" class="download transition br" href="/Linux/download-XJ3D.-10029883.htm"><i class="fa fa-download"></i> Download</a></p> </article> <article class="app-list sb clearfix"> <figure class="figure fl"> <a class="thumbnail" href="/Linux/download-Ecli.-10029893.htm"> <img class="img-cover br" src="https://icon.softwaresea.com/48x48/5/64/1031859.27fe6c7bf502668311a9a410bc86aa0c.gif"/> </a> </figure> <div class="content fl"> <h2 class="title ellipsis"><a href="/Linux/download-Ecli.-10029893.htm"> Ecli. </a></h2> <p class="intro ellipsis"> Ecli é um invólucro Eiffel em torno do X / Open ISO / CLI (interface de nível de chamada), que define uma API para drivers RDBMS e usa o SQL92 ...</p> <p class="data clearfix"> <time class="time fl"> <i class="fa fa-calendar"></i>N/A</time> <span class="view fl hidden-sm-md-lg"><i class="fa fa-download"></i>149</span> <span class="view"><i class="fa fa-save"></i></span> </p> </div> <p class="btn fr"><a rel="nofollow" class="download transition br" href="/Linux/download-Ecli.-10029893.htm"><i class="fa fa-download"></i> Download</a></p> </article> <article class="app-list sb clearfix"> <figure class="figure fl"> <a class="thumbnail" href="/Linux/download-Centro-de-Dados-Virtual-10029903.htm"> <img class="img-cover br" src="https://icon.softwaresea.com/48x48/5/64/1031866.0846c6338dc64518d97e48dd8e207e61.jpg"/> </a> </figure> <div class="content fl"> <h2 class="title ellipsis"><a href="/Linux/download-Centro-de-Dados-Virtual-10029903.htm"> Centro de Dados Virtual </a></h2> <p class="intro ellipsis"> O Virtual Data Center (VDC) é um sistema de biblioteca digital ...</p> <p class="data clearfix"> <time class="time fl"> <i class="fa fa-calendar"></i>N/A</time> <span class="view fl hidden-sm-md-lg"><i class="fa fa-download"></i>168</span> <span class="view"><i class="fa fa-save"></i></span> </p> </div> <p class="btn fr"><a rel="nofollow" class="download transition br" href="/Linux/download-Centro-de-Dados-Virtual-10029903.htm"><i class="fa fa-download"></i> Download</a></p> </article> <article class="app-list sb clearfix"> <figure class="figure fl"> <a class="thumbnail" href="/Linux/download-Sene.-10029913.htm"> <img class="img-cover br" src="https://icon.softwaresea.com/48x48/5/64/1031879.5b4177c13e767271e48915e36e959e73.gif"/> </a> </figure> <div class="content fl"> <h2 class="title ellipsis"><a href="/Linux/download-Sene.-10029913.htm"> Sene. </a></h2> <p class="intro ellipsis"> SGE é uma biblioteca gráfica para a excelente biblioteca Simple DirectMedia Layer (SDL) (principalmente) escrita por Sam Lantinga. ...</p> <p class="data clearfix"> <time class="time fl"> <i class="fa fa-calendar"></i>N/A</time> <span class="view fl hidden-sm-md-lg"><i class="fa fa-download"></i>158</span> <span class="view"><i class="fa fa-save"></i></span> </p> </div> <p class="btn fr"><a rel="nofollow" class="download transition br" href="/Linux/download-Sene.-10029913.htm"><i class="fa fa-download"></i> Download</a></p> </article> </div> </section> <aside id="sidebar" class="hidden-sm-md-lg fr"> <div class="theiaStickySidebar"> <section id="aside_qr" class="widget widget_aside_qr sb br mb"> <div class="widget-content aside_qr"> <p class="c-title mb10"><span>Propaganda</span></p> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-8413949402593124" crossorigin="anonymous"></script> <!-- zheng-zsy --> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-8413949402593124" data-ad-slot="7018312873" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> </section> <section id="aside_hot_comment" class="widget widget_aside_hot_comment sb br mb"> <p class="c-title mb10"><span class="name">Software Relacionado</span></p> <ul class="widget-content aside_hot_comment"> <li class="list clearfix"> <a href="/Linux/download-PHP-controller.-10029923.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/64/1031889.82010bd9f6c0d789845d03e0d9425e43.gif"></span> <div class="new-text"> <p class="title ellipsis"> PHP-controller. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 168</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-LIFIZIDADE.-10029933.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/64/1031897.9f415bf703cad3f9caa1f19d7f4ae24c.gif"></span> <div class="new-text"> <p class="title ellipsis"> LIFIZIDADE. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 138</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-Raspe-%3A%3A-USPS-%3A%3A-Ziplookup-Perl-M%F3dulo-10029943.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/64/1031906.6f6db7a6929e5ba67b78690ca63a8016.gif"></span> <div class="new-text"> <p class="title ellipsis"> Raspe :: USPS :: Ziplookup Perl Módulo </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 265</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-libparlled.-10029953.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/64/1031916.c20ade1c541628cabfbe4b3107496746.gif"></span> <div class="new-text"> <p class="title ellipsis"> libparlled. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 142</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-Pathan-p.-10029963.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/64/1031925.e5fc3dd8c0b7f3ad80063afdf0dd7364.gif"></span> <div class="new-text"> <p class="title ellipsis"> Pathan-p. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 354</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-Bioma.-10029975.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/57/1028349.3d76c52468060b5a8c7622adb597994b.gif"></span> <div class="new-text"> <p class="title ellipsis"> Bioma. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 173</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-libacarsd.-10029985.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/57/1028362.8a2ddf4a131a6517f75e1174b5e3cb50.gif"></span> <div class="new-text"> <p class="title ellipsis"> libacarsd. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 160</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-Canal-10029996.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/57/1028398.e1a59e76728ab931ea74e293d90ee0cb.gif"></span> <div class="new-text"> <p class="title ellipsis"> Canal </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 204</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-Biblioteca-de-classes-de-ferramentas-ionflux-10030006.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/57/1028409.3b43d1f0344c7f74b4255e3b4fd9969d.gif"></span> <div class="new-text"> <p class="title ellipsis"> Biblioteca de classes de ferramentas ionflux </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 161</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-Libckpt.-10030017.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/62/1030901.180d8816301731676d2f0de8d45a25b6.gif"></span> <div class="new-text"> <p class="title ellipsis"> Libckpt. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 97</font> </div> </div> </a> </li> <li class="list clearfix"> <a href="/Linux/download-DemOkritos.-10030027.htm"> <span class="img-wrap fl"><img class="img-cover br lazyload" src="https://icon.softwaresea.com/48x48/5/62/1030916.fc2af50c8ba2f1c99dd6adf79f0b6ce0.gif"></span> <div class="new-text"> <p class="title ellipsis"> DemOkritos. </p> <div class="info"> <font color="888888"><i class="fa fa-download"></i> 130</font> </div> </div> </a> </li> </ul> </section> </div> </aside> </div> </div> <div class="flink sb br mb"> <p class="c-title">Sobre nós</p> <ul id="flink" class="f-list clearfix"> softwaresea.com fornece o mais recente centro de download de software verde gratuito em casa e no exterior, incluindo software de computador, aplicativo da apple, aplicativo Android e outros downloads de software móvel gratuito para computador. Se você quiser saber mais sobre o software livre verde, baixe-o em softwaresea.com! </ul> </div> <footer class="footer"> <div class="main container"> <div class="f-about"> <p> 2009 softwaresea.com All rights reserved. <a href="/privacy.html" rel="nofollow">Política de Privacidade</a> | <a href="mailto:softwareseasite@gmail.com">Anuncie conosco</a> | <a rel="nofollow" href="https://www.softwaresea.com/submit_software.php?soft_type=lc">Enviar software</a> </p> </div> </div> <div id="toolbar" class="toolbar"> <div id="totop" class="btn hidden br transition"><i class="fa fa-arrow-up"></i></div> </div> </footer> <div id="mask-hidden" class="mask-hidden transition"></div> <script src="/images/common.js"></script> <script src="/images/headroom.min.js"></script> <script type="text/javascript"> $(document).ready(function(e) { $(".table_card .tab li").click(function() { $(".table_card .tab li").eq($(this).index()).addClass("active").siblings().removeClass("active"); $(".table_card .tabCon ul").hide().eq($(this).index()).show(); }) }); </script> </body> </html>