Www :: pdascraper.

www :: pdascraper é uma classe Perl para raspar conteúdo amigável por websites.
Baixe Agora

Www :: pdascraper. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Perl Artistic License
  • Preço:
  • FREE
  • Nome do editor:
  • John Horner
  • Site do editor:
  • http://search.cpan.org/~codyp/WWW-PDAScraper-0.1/PDAScraper.pm

Www :: pdascraper. Tag


Www :: pdascraper. Descrição

Www :: pdascraper é uma classe Perl para raspar conteúdo amigável por websites. Www :: pdascraper é uma classe Perl para raspagem de conteúdo amigável por websites.synopsis Use www :: pdascraper; Meu $ scraper = www :: pdascraper-> Novo QW (NewCientist Yahoo :: Entretenimento); $ scraper-> raspar (); ou usar www :: pdascraper; Meu $ scraper = www :: pdascraper-> novo; $ scraper-> raspar qw (newscientist yahoo :: entretenimento); ou perl -mwww :: pdascraper -e "raspar qw (newscientist yahoo :: entretenimento)" tendo escrito vários scripts kludgey para baixar conteúdo amigável por PDA de vários sites, i Decidiu escrever uma solução generalizada que iria analisar a seção de uma página de notícias que contém os links que queremos * munge esses links na URL para a versão impressa, se possível * baixar essas páginas e fazer uma página de índice Para eles, a movimentação das páginas para o seu PDA não faz parte do escopo do módulo: o navegador de código aberto e "destilador", o Plucker, de http://plkr.org/ é recomendado. Basta obter para ler o arquivo index.html com uma profundidade de 1 do disco, usando um URL como arquivo: ///path/to/index.htmlThe sub-moduleswww :: pdascraper usa um conjunto de regras para raspando um site específico De um segundo módulo, ou seja, www :: pdascraper :: yahoo :: entretenimento :: TV contém as regras para raspar o site do Yahoo TV: pacote www :: pdascraper :: Yahoo :: Entretenimento :: TV; # Www :: pdascraper.pm Regras para raspar o site # Yahoo TV Sub config {return {name => 'yahoo tv', start_from => 'http://news.yahoo.com/i/763', chunk_spec => , URL_REGEX => }; } 1; uma seleção mais ou menos aleatória de módulos é incluída, bem como um conjunto completo para o Yahoo, para demonstrar um conjunto lógico de módulos nas categorias. Cristando um novo sub-módulo deve ser relativamente simples, ver o modelo fornecido, Www :: pdascraper :: template.pm - você precisa de nome, start_from, então ou chunk_spec ou url_spec, opcionalmente uma URL_REGEX para transformação no URL amigável. Então, mova seu novo módulo para o mesmo local que os outros em Seu sistema, ou verifique se eles estão disponíveis para o seu script com uma linha como usar lib '/ caminho / para / local / módulos / pdascraper /' requisitos: · Perl.


Www :: pdascraper. Software Relacionado