pyuca.

Python Unicode Collation Algorithm Implementação
Baixe Agora

pyuca. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Other/Proprietary Li...
  • Preço:
  • FREE
  • Nome do editor:
  • James Tauber
  • Site do editor:
  • http://jtauber.com/pyso

pyuca. Tag


pyuca. Descrição

Pyuca é uma tentativa preliminar de uma implementação Python do Algoritmo de Collação Unicode (UCA) .Developer Comentsi originalmente postou no meu blog em 2006, mas parece obter o uso suficiente Isso realmente pertence aqui (e em Pypi). O núcleo do algoritmo envolve comparação multi-nível. Por exemplo, o Café vem antes do Caff porque no nível principal, o sotaque é ignorado e a primeira palavra é tratada como se fosse café. O nível secundário (que considera acentos) só se aplica apenas a palavras que são equivalentes no nível primário. O algoritmo de colação Unicode e a Pyuca também suportam contração e expansão. Contração é onde várias letras são tratadas como uma única unidade. Em espanhol, o CH é tratado como uma carta que vem entre C e D de modo que, por exemplo, palavras que começam o ch devem classificar depois de todas as outras palavras começos com c. A expansão é onde uma única letra é tratada como se fosse várias letras. Em alemão, Ä é classificado como se fosse AE, ou seja, depois do anúncio, mas antes de AF.Aqui é como usar o Pyuca Module.pip Instalar Pyucausage Exemplo: de Pyuca Import Collatorc = Collator ("Allkeys.txt") Sorted_words = classificado ( Palavras, tecla = c.sort_key) alkeys.txt (1 MB) está disponível Athttp: //www.unicode.org/public/uca/latest/allkeys.txtUduct's Homepage


pyuca. Software Relacionado