Texto :: Unidecode.

Texto :: Unidecode é uma transliteração US-ASCII do texto Unicode.
Baixe Agora

Texto :: Unidecode. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Perl Artistic License
  • Preço:
  • FREE
  • Nome do editor:
  • Sean M. Burke
  • Site do editor:
  • http://search.cpan.org/~sburke/

Texto :: Unidecode. Tag


Texto :: Unidecode. Descrição

Texto :: Unidecode é uma traduitações dos EUA-ASCII do Texto Unicode. Texto :: Unidecode é uma transliterações US-ASCII de Texto Unicode.Synopsis Use UTF8; Use texto :: Unidecode; imprimir unidecode ("x {5317} x {4eb0} n" # esses são os caracteres chineses para Pequim); # Que imprime: Bei Jingit muitas vezes acontece que você tem dados de texto não-romanos no Unicode, mas você não pode exibi-lo - geralmente porque você está tentando mostrá-lo a um usuário por meio de um aplicativo que não suporta Unicode, ou porque as fontes que você precisa não são acessíveis. Você poderia representar os personagens Unicode como "???????" ou "15Ba15a01610 ...", mas isso é quase inútil para o usuário que realmente quer ler o que o texto diz. Qual texto :: Unidecode fornece é uma função, Unidecode (...) que leva dados Unicode e tenta representá-lo Nos caracteres US-ASCII (ou seja, os caracteres universalmente exibidos entre 0x00 e 0x7F). A representação é quase sempre uma tentativa de transliteração - isto é, transmitindo, em letras romanas, a pronúncia expressa pelo texto em algum outro sistema de escrita. (Veja o exemplo na sinopse.) A capacidade do Unidecode de transliterar é limitada por dois fatores: · O valor e a qualidade dos dados no originalSo se você tiver dados hebraicos que não têm pontos de vogal nele, então o Unidecode não pode adivinhar quais as vogais devem aparecer em uma pronúncia. S f y hv n vwls n th npt, y w não gt ny vwls n tpt. (Esta é uma aplicação específica do princípio geral de "lixo em, lixo".) · Limitações básicas no desentém do Unidecode Um algoritmo real e inteligente de transliteração para qualquer idioma único geralmente requer muito tempo, e pelo menos um conhecimento passável da linguagem envolvida. Mas o texto Unicode pode transmitir mais idiomas do que eu poderia aprender (muito menos criar um transliterado para) em todo o resto da minha vida. Então eu coloco um boné sobre como o Unidecode inteligente poderia ser, insistindo que suporta apenas a transliteração insensível em contexto. Isso significa perder os detalhes mais finos de qualquer sistema de escrita, enquanto ainda espero ser útil.UNIDO, em outras palavras, é rápido e sujo. Às vezes a saída não é tão suja: russo e grego parecem funcionar passavelmente; E enquanto Thaana (Divehi, Aka Maldivian) é um sistema de escrita definitivamente não-ocidental, a criação de um mapeamento para as cartas romanas parece funcionar muito bem. Mas às vezes a saída é muito suja: O Unidecode faz muito mal em japonês e tailandês. Se você quer uma transliteração mais inteligente para uma linguagem específica do que o Unidecode fornece, então você deve procurar (ou escrever) um algoritmo de transliteração específico para esse idioma e aplicar Em vez de (ou pelo menos antes) aplicando unidecode.in Outras palavras, a abordagem do Unidecode é ampla (sabendo sobre dezenas de sistemas de escrita), mas superficial (não sendo meticuloso sobre qualquer um deles). Requisitos: · Perl.


Texto :: Unidecode. Software Relacionado