Tesseract-OCR.

motor OCR que foi desenvolvido no HP Labs entre 1985 e 1995 e agora no Google
Baixe Agora

Tesseract-OCR. Classificação e resumo

Propaganda

  • Rating:
  • Nome do editor:
  • theraysmith
  • Site do editor:
  • Sistemas operacionais:
  • Windows XP / Vista / 7
  • Tamanho do arquivo:
  • 0 KB

Tesseract-OCR. Tag


Tesseract-OCR. Descrição

Editar por Tesseract é provavelmente o motor OCR de código aberto mais preciso disponível. Combinado com a biblioteca de processamento de imagens Leptonica, ela pode ler uma ampla variedade de formatos de imagem e convertê-los em texto em mais de 60 idiomas. Foi um dos 3 melhores motores no teste de precisão de 1995. Entre 1995 e 2006, tinha pouco trabalho sobre isso, mas desde então foi melhorado extensivamente pelo Google. Notas de lançamento de Tesseract 23 de outubro de 2012 - v3.02.02 - Responsitador movido / páginaiterador para ccmain. - Adicionado capacidade de direita para a esquerda / bidi nos iteradores de saída para hebraico / árabe. - Adicionada detecção de parágrafo na análise de layout / Post OCR. - Corrigido Xheight inconsistente durante o treinamento e o excessivo. - Adicionado capacidade de multi-linguagem simultânea. - Módulo de reconhecimento de palavra de nível superior refatorado. - Detector de equação experimental adicionado. - Melhor tratamento de resolução a partir de imagens de entrada. - Módulo de Blamer adicionado para análise de erros. - Limpo para o namespace usado externamente, removendo inclui de BasAPI.H. - Removido o código de gerenciamento de memória morta. - limita as restrições nos parâmetros de controle. - Adicionado suporte para shapetable no classificador e treinamento. - Puner de classe refatada. - Corrigidos vazamentos de treinamento e aleatoriedade. - Principais melhorias na análise de layout para melhor detecção de imagens, detecção diacrítica, melhor visualização de linha de texto, melhor achado tabstop. - Detecção e remoção de linha melhorada. - Atregado helicóptero fixo para CJK. - Adicionado Unicharset a Werd_Choice para facilitar a manipulação de vários idiomas. - Corrigidos problemas com imagens escaladas internamente. - Adicionado página e BBox para string em arquivos tr para identificar melhor a fonte de dados de treinamento. - Fixos para o divisor Hindi Shiroreka. - Correção de Bigram da palavra adicionada. - Redução do consumo de memória de pilha e eliminou alguns typedefs feios. - Adicionado nova API de classificador uniforme. - Adicionado novo contador de erros de treinamento. - Corrigido erro endiano no leitor dawg. - C API (graças a Tobias Müller) - Nova solução para VS 2008 (graças a Tom Powers) - E mais...


Tesseract-OCR. Software Relacionado

Baixar svn.

Utilitário simples que permite fazer o download de repositórios do Subversion (SVN) e Git ...

237 9 KB

Download