| WikiPrep. script Perl para pré-processamento de despejos XML Wikipedia |
Baixe Agora |
WikiPrep. Classificação e resumo
- Nome do editor:
- Evgeniy Gabrilovich
- Sistemas operacionais:
- Mac OS X
- Tamanho do arquivo:
- 26 KB
WikiPrep. Tag
WikiPrep. Descrição
Script Perl para pré-processamento de despejos XML Wikipedia O WikiPREP é um script Perl que analisa os dumping de dados MediaWiki no formato XML e extrai informações úteis a partir deles. A WikiPREP implementa um subconjunto da sintaxe MediaWiki (como a inclusão de modelo com parâmetros, links externos e internos, redirecionamentos, títulos, etc) é na forma de vários arquivos: alguns deles em formato simples, orientado a linhas e alguns deles em formato. Xml. Um dos arquivos também contém páginas de Wikipedia processadas em uma sintaxe simples de HTML. O objetivo do WikiPREP é converter despejos de dados da Wikipedia em um formato que possa ser facilmente processado com outras ferramentas. Essas ferramentas então não precisam ter o total conhecimento de todas as peculiaridades e cantos estranhos da sintaxe MediaWiki. Requisitos: · Perl.
WikiPrep. Software Relacionado