Swish-e.

Projeto de código aberto que irá ajudá-lo a indexar arquivos e páginas da web
Baixe Agora

Swish-e. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • GPL
  • Preço:
  • FREE
  • Nome do editor:
  • The Swish-e Project
  • Site do editor:
  • http://swish-e.org/
  • Sistemas operacionais:
  • Mac OS X
  • Tamanho do arquivo:
  • 1.4 MB

Swish-e. Tag


Swish-e. Descrição

Projeto de código aberto que irá ajudá-lo a indexar arquivos e páginas da web Swish-e é um sistema de código aberto rápido, flexível e gratuito para as coleções de indexação de páginas da Web ou outros arquivos. Swish-e é ideal para coleções de um milhão de documentos ou menor. Usando o parser gnome libxml2 e uma coleção de filtros, Swish-e pode indexar texto simples, Microsoft Word / PowerPoint / Excel, E-mail, PDF, HTML, XML e apenas qualquer arquivo que possa ser convertido em texto XML ou HTML . Swish-E também é frequentemente usado para complementar bancos de dados, como o MySQL DBMS para pesquisa de texto completo muito rápido. Aqui estão algumas características principais de "Swish-E": · Indique rapidamente um grande número de documentos em diferentes formatos, incluindo texto, HTML e XML. · Use "filtros" para indexar outros tipos de arquivos, como PDF, GZIP ou PostScript. · Inclui uma aranha da Web para indexação de documentos remotos em HTTP. Segue as regras de exclusão de robôs (incluindo meta tags). · Pode usar um programa externo para fornecer documentos para Swish-E, como uma aranha avançada para o seu servidor da Web ou um programa para ler e formatar registros de um banco de dados relacional. · Documentar "Propriedades" (Alguns subconjuntos do documento de origem, geralmente definidos como elementos META ou XML) podem ser armazenados no índice e retornados com os resultados da pesquisa. · Resumos de documentos podem ser devolvidos com cada pesquisa. · Palavra stemming, Soundex, Metafone e Indexação de Metafone duplo para pesquisa "Fuzzy" · Pesquisa de frase e busca curinga · Limite as pesquisas nos links HTML. · Use poderosas expressões regulares para selecionar documentos para indexação ou exclusão. · Limite facilmente as pesquisas a partes ou todo o seu site. · Os resultados podem ser classificados por relevância ou por qualquer número de propriedades em ordem crescente ou descendente. · Limite as pesquisas em partes de documentos, como certas tags HTML (meta, título, comentários, etc.) ou para elementos XML. · Pode reportar erros estruturais em seus documentos XML e HTML. · O arquivo de índice é portátil entre plataformas. · Uma biblioteca Swish-E é fornecida para permitir incorporar o Swish-e em seus aplicativos para pesquisa muito rápida. Um módulo Perl está disponível que fornece uma API padrão para acessar o Swish-e. · Inclui exemplo Script de pesquisa com resumos de contexto e prazo de pesquisa e realização de frases. Pode ser usado com sistemas populares de modelos de perl. · Swish-e é rápido. · É de código aberto e livre! Você pode personalizar Swish-E e você pode contribuir com seus novos recursos extravagantes para o projeto. · Suportado por grupos de usuários e desenvolvedores on-line. O que há de novo nesta versão: · Manipulação fixa de 'deflate' em Spider.pl · Re-indexação necessária · Bug de stemer fixo introduzido em 2.4.4 · Agora Fork / Exec para executar filtros · Avisos assinados / não assinados fixos do GCC 4.x · MakeFile.Mingw incluído no Distib


Swish-e. Software Relacionado

Forkshorcut.

Add-on do Firefox que permite usar teclas de função para criar atalhos para URLs. ...

145 4 KB

Download