| Web :: raspador Web Scraping Toolkit usando Selectores HTML e CSS ou Expressões XPath |
Baixe Agora |
Web :: raspador Classificação e resumo
- Licença:
- Perl Artistic License
- Nome do editor:
- Tatsuhiko Miyagawa
- Site do editor:
- http://search.cpan.org/~miyagawa/
Web :: raspador Tag
Web :: raspador Descrição
Web Scraping Toolkit usando Selectores HTML e CSS ou Expressões XPath Web :: Scraper é um kit de ferramentas do raspador da Web, inspirado pelo escrúpulo equivalente de Ruby. Ele fornece uma interface DSL-ISH para percorrer documentos HTML e retornar um strpture de dados Perl organizado perfeitamente. O raspador e os blocos de processo fornecem um método para definir quais segmentos de um documento para extrair. Entende CSS e Selectores HTML, bem como Expressões XPath.Synopsis Use URI; use web :: raspador; # Primeiro, crie o seu bloco de raspador Meus $ Tweets = scraper {# Analise todos os lis com o "status" da classe, armazená-los em um disqueiro # Array 'Tweets'. Nós incorporamos outro raspador para cada tweet. Processo "li.status", "Tweets []" => raspador {# e, nessa matriz, puxe o Elemento com a classe # "entrada de entrada", "data-date" e o processo de link ". conteúdo ", corpo => 'texto'; processo ".entry-date", quando => 'texto'; processo 'a ', link => '@href'; }; }; Meus $ res = $ tweets-> raspar (uri-> novo ("http://twitter.com/miyagawa")); # O resultado tem a matriz de tweets populados para o meu $ Tweet (@ {$ res -> {tweets}}) {print "$ tweet -> {Body} $ Tweet -> {quando} (link: $ tweet -> {link }) \ n "; } Requisitos: · Perl.
Web :: raspador Software Relacionado