Recursos do documento a serem considerados antes do OCR

Download

A qualidade das imagens tem um impacto significativo na qualidade do reconhecimento. Esta seção explica os fatores que devem ser levados em conta antes do reconhecimento de imagens:

Idiomas do documento

O ABBYY FineReader reconhece documentos simples e com vários idiomas (por exemplo, escritos em dois ou mais idiomas). No caso de documentos em vários idiomas, você precisa selecionar vários idiomas de reconhecimento.

Para especificar um idioma de OCR para seu documento, na lista suspensa Idioma do documento, na barra de ferramentas principal ou na janela de Tarefa, selecione uma das seguintes opções:

  • Seleção automática

O ABBYY FineReader selecionará automaticamente os idiomas adequados da lista de idiomas definida pelo usuário. Para modificar essa lista:

  1. Selecione Mais idiomas…
  2. Na caixa de diálogo Editor de idiomas, selecione a opção Selecionar automaticamente os idiomas dos documentos da seguinte lista.
  3. Clique no botão Especificar….
  4. Na caixa de diálogo Idiomas, selecione os idiomas desejados.
  • Um idioma ou uma combinação de idiomas

Selecione um idioma ou uma combinação de idiomas. A lista de idiomas inclui os idiomas de reconhecimento recentemente usados, além de inglês, alemão e francês.

  • Mais idiomas…

Selecione essa opção se o idioma necessário não estiver visível na lista.

Na caixa de diálogo Editor de idiomas, selecione a opção Especificar os idiomas manualmente, em seguida, selecione o idioma ou os idiomas desejados, marcando as caixas apropriadas. Se você costuma usar uma determinada combinação de idiomas, será possível criar um novo grupo para esses idiomas.

Se um idioma não estiver na lista:

  1. Esse idioma não é suportado pelo ABBYY FineReader.

Para obter uma lista completa dos idiomas suportados, consulte "Idiomas suportados".

  1. O idioma não é suportado pela cópia do seu software.

A lista completa de idiomas disponíveis em sua cópia pode ser encontrada na caixa de diálogo Licenças (Ajuda > Sobre… > Informações sobre a Licença).

Além de usar idiomas integrados e grupos de idiomas, será possível criar o seu próprio. Para obter detalhes, consulte "Se o programa não reconhecer alguns dos caracteres".

Tipo de impressão

Os documentos podem ser impressos em vários dispositivos, como máquinas de escrever e aparelhos de fax. A qualidade do OCR pode ser melhorada através da seleção do Tipo de documento correto na caixa de diálogo Opções.

Para a maioria dos documentos, o programa detectará o tipo de impressão automaticamente. Para a detecção automática do tipo de impressão, a opção Auto deve ser selecionada em Tipo de documento, na caixa de diálogo Opções (Ferramentas > Opções…). É possível processar o documento no modo preto e branco ou em cores.

Também é possível optar por selecionar manualmente o tipo de impressão, de acordo com a necessidade.

Um exemplo de texto digitado. Todas as letras têm a mesma largura (compare, por exemplo, "w" e "t"). Para textos desse tipo, selecione Máquina de escrever.
Um exemplo de um texto produzido por um aparelho de fax. Como você pode ver no exemplo, as letras não são claras em alguns locais, além de ter ruído e distorções. Para textos desse tipo, selecione Fax.

Dica: depois de reconhecer documentos datilografados ou fax, não se esqueça de selecionar Automático antes de processar documentos impressos regulares.

Qualidade da impressão

Documentos de baixa qualidade com "ruído" (ou seja, pontos pretos aleatórios ou manchas), letras borradas e irregulares ou linhas distorcidas e bordas deslocadas da tabela pode exigir configurações específicas de digitalização.

Fax Jornal

A digitalização de documentos de baixa qualidade é melhor em escala de cinza. Ao digitalizar em tons de cinza, o programa selecionará automaticamente o valor de brilho ideal.

O modo de digitalização em tons de cinza retém mais informações sobre as letras no texto digitalizado para alcançar melhores resultados de OCR, durante o reconhecimento de documentos de média a baixa qualidade. Também é possível corrigir alguns dos defeitos manualmente usando as ferramentas de edição de imagens disponíveis no Editor de imagem. Para obter detalhes, consulte "Pré-processamento de imagem".

Modo de cor

Se não for necessário preservar as cores originais de um documento em cores, você pode processar o documento no modo preto e branco. Isso reduzirá significativamente o tamanho do documento do ABBYY FineReader resultante e acelerará o processo de OCR. No entanto, o processamento de imagens de baixo contraste em preto e branco pode resultar em baixa qualidade do OCR. Também não é recomendável o processamento em preto e branco de fotos, páginas de revistas e textos em chinês, japonês e coreano.

Observação: também é possível acelerar o reconhecimento de documentos em cor e em preto e branco, selecionando a opção Leitura rápida na guia Ler da caixa de diálogo Opções. Para saber mais sobre os modos de reconhecimento, consulte Opções do OCR.

Para selecionar um modo de cor:

  • Use a lista suspensa Modo de cor na caixa de diálogo Tarefa ou
  • Selecione uma das opções em Modo de cor, na guia Documento da caixa de diálogo Opções (Ferramentas > Opções…).

Importante! Assim que o documento for convertido para o branco e preto, não será mais possível restaurar as cores. Para obter um documento em cores, abra o arquivo com imagens coloridas ou digitalize o documento em papel no modo de cor.

14.01.2020 17:26:21

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.