Jericho Html Parser.

Parser HTML gratuito e aberto para o seu Mac
Baixe Agora

Jericho Html Parser. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • GPL
  • Preço:
  • FREE
  • Nome do editor:
  • M Jericho
  • Site do editor:
  • http://jericho.htmlparser.net/doc/index.html
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 1.7 MB

Jericho Html Parser. Tag


Jericho Html Parser. Descrição

Parser HTML gratuito e aberto para o seu Mac O Jericho HTML Parser é uma biblioteca Java de código aberto, permitindo a análise e a manipulação de partes de um documento HTML, incluindo tags do lado do servidor, realizando textos em qualquer HTML inválido ou não reconhecido. O Jericho HTML Parser também fornece funções de manipulação de forma HTML de alto nível. Aqui estão algumas características principais do "Jericho Html Parser": · · A presença de HTML mal formatada não interfere na análise do restante do documento, o que torna a biblioteca ideal para uso com o HTML "real do mundo" que engasga outros analisadores. · · As tags PHP, JSP, ASP, PSP e Mason Server são explicitamente reconhecidas pelo analisador. Isso significa que o HTML normal ainda é analisado corretamente mesmo se houver tags de servidor dentro deles, o que é comum, por exemplo, quando definir dinamicamente os atributos de elementos. · Não é nem um parser de evento nem baseado na árvore, mas usa uma combinação de pesquisa de texto simples, reconhecimento de tag eficiente e um cache de posição de tag. O texto do documento de origem inteira é carregado pela primeira vez na memória e apenas os segmentos relevantes pesquisaram os caracteres relevantes de cada operação de pesquisa. · · Comparado a um analisador à base de árvores, como Dom, os requisitos de memória e recursos podem ser muito melhores se apenas pequenas seções do documento precisarem ser analisadas ou modificadas. HTML incorreto ou mal formatado pode ser facilmente ignorado, ao contrário dos analisadores baseados em árvore, que devem identificar todos os nó no documento de cima para baixo. · · Comparado a um analisador baseado em evento, como o Sax, a interface está em um nível muito mais alto e mais intuitiva, e uma representação de árvore da hierarquia do elemento de documento é facilmente criada, se necessário. · · As posições iniciais e finais no documento de origem de todos os segmentos analisados são acessíveis, permitindo a modificação de apenas segmentos selecionados do documento sem ter que reconstruir todo o documento de uma árvore. · · A linha e o número da coluna de cada posição no documento de origem são facilmente acessíveis. · · Fornece uma interface simples, mas abrangente, para a análise e manipulação de controles de formulários HTML, incluindo a extração e população de valores iniciais e conversão para os modos de exibição de somente ou de dados. A análise dos controles de formulário também permite que os dados recebidos do formulário sejam armazenados e apresentados de maneira apropriada. · · Os tipos de tags personalizados podem ser facilmente definidos e registrados para reconhecimento pelo analisador. · · Funcionalidade integrada para extrair todo o texto da marcação HTML, adequada para alimentação em um mecanismo de busca de texto, como Apache Lucene. · · Funcionalidade integrada para renderizar a marcação HTML com formatação de texto simples. · · Funcionalidade integrada para formatar o código-fonte HTML que recua elementos de acordo com sua profundidade na hierarquia do elemento de documento. · · Funcionalidade integrada para o código fonte HTML compacta, removendo todo o espaço branco desnecessário.


Jericho Html Parser. Software Relacionado

Raiva webdesign.

Criar página da Web, testá-los em todos os navegadores e publica-os com este software incrível ...

608 17.4 MB

Download

Enkoder.

Enkoder - Esconde endereços de e-mail publicados em sites de colheitadeiras de spam ...

166 147 KB

Download