Características do documento a serem consideradas antes de aplicar o OCR

Download

A qualidade das imagens tem um impacto significativo na qualidade de OCR. Esta seção explica os fatores que você deve levar em conta antes do reconhecimento de imagens.

Idiomas OCR

O ABBYY FineReader pode reconhecer documentos uni e multilíngues (por exemplo, escritos em dois ou mais idiomas). Para documentos multilíngues, você precisa selecionar vários idiomas de OCR.

Para selecionar idiomas OCR, clique em Opções >  Idiomas e selecione uma das seguintes opções:

  • Selecionar automaticamente os idiomas de OCR da seguinte lista
    O ABBYY FineReader selecionará automaticamente os idiomas apropriados na lista de idiomas definida pelo usuário. Para editar a lista de idiomas:
    1. Certifique-se de que a opção Selecionar automaticamente os idiomas de OCR da seguinte lista foi selecionada.
    2. Clique no botão Especificar....
    3. Na lista suspensa Idiomas, selecione os idiomas desejados e clique em OK.
    4. Na lista suspensa Opções, clique em OK.
  • Especificar os idiomas de OCR manualmente
    Selecione esta opção se o idioma desejado não estiver na lista.

Na caixa de diálogo abaixo, especifique um ou mais idiomas. Se você costuma usar uma combinação de idiomas específico, pode... Criar um novo grupo para esses idiomas.

Se um idioma não estiver na lista:

  1. Não é compatível com o ABBYY FineReader ou
    Para obter uma lista completa de idiomas compatíveis, consulte Idiomas OCR compatíveis.
  2. Não compatível com a sua versão do produto.
    A lista completa de idiomas disponíveis em sua versão do produto pode ser encontrada na caixa de diálogo Licenças (clique em Ajuda > Sobre... > Informações sobre a licença para abrir esta caixa de diálogo).

Além de usar os idiomas e grupos de idiomas incorporados, você pode criar seus próprios grupos e idiomas. Veja também: Se o programa falhar em reconhecer determinados caracteres.

Tipo de impressão

Documentos podem ser gerados usando vários dispositivos como máquinas de escrever e máquinas de fax. A qualidade de OCR pode variar dependendo de como um documento foi impresso. Você pode melhorar a qualidade de OCR, selecionando o tipo correto de impressão na caixa de diálogo Opções.

Para a maioria dos documentos, o programa detectará automaticamente o tipo de impressão. Para a detecção de tipo automático de impressão, a opção Automático deve ser selecionada no Tipo de documento grupo de opções na caixa de diálogo Opções (clique em Ferramentas > Opções... > OCR para acessar essas opções). Você pode processar documentos no modo colorido ou em preto e branco.

Você também pode optar por selecionar manualmente o tipo de impressão conforme necessário.

Um exemplo de texto digitado. Todas as letras são de largura igual (comparar, por exemplo, "w" e "t"). Para textos deste tipo, selecione Máquina de escrever.
Um exemplo de um texto produzido por uma máquina de fax. Como você pode ver no exemplo, as letras não são claras em alguns lugares. Há também algum ruído e distorção. Para textos deste tipo, selecione Fax.

Após reconhecer textos datilografados ou faxes, certifique-se de selecionar Automático antes de processar documentos impressos comuns.

Qualidade de impressão

Os documentos de baixa qualidade, com "ruídos" (isto é, com pontos negros aleatórios ou marcas), borrados e com letras com tamanhos variados, com linhas desalinhadas e bordas de tabela alteradas exigem configurações de digitalização específicas.

Fax Jornal

Documentos de má qualidade são melhor digitalizados em tons de cinza. Ao digitalizar em tons de cinza, o programa irá selecionar o valor ideal de brilho automaticamnete.

O modo de digitalização em tons de cinza retém mais informações sobre as letras no texto digitalizado para atingir melhores resultados de OCR quando reconhecer documentos de média a baixa qualidade. Você também pode corrigir alguns dos defeitos manualmente usando as ferramentas disponíveis no editor de imagens. Veja também: Se a imagem do documento apresentar defeitos e a precisão do OCR estiver baixa.

Modo de cor

Se não precisar preservar as cores originais de um documento a cores, pode processar o documento no modo preto e branco. Isto reduz extremamente o tamanho do projeto OCR resultante e acelera o processo de OCR. No entanto, o processamento de imagens de baixo contraste em preto e branco pode resultar em má qualidade de OCR. Também não recomendamos o processamento em preto e branco de fotos, páginas de revistas e textos em chinês, japonês e coreano.

Dica. Você também pode acelerar o OCR de documentos em preto e branco e cor, selecionando Reconhecimento rápido no menu OCR da caixa de diálogo Opções. Para mais informações sobre os modos de reconhecimento, consulte Opções de OCR.

Para algumas recomendações adicionais sobre como selecionar o modo de cor certa, consulte Dicas de digitalização.

Uma vez que o documento é convertido para preto e branco, você não será capaz de restaurar as cores. Para obter um documento colorido, abra um arquivo com imagens coloridas ou digitalize o documento no modo de cor.

12.06.2024 14:31:19

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.