Se o seu documento impresso contiver fontes fora do padrão

O modo Definição aprimora a qualidade de OCR em documentos com fontes decorativas ou documentos contendo caracteres especiais (por exemplo, símbolos matemáticos).

Observação: não é aconselhável usar o modo Definição em outros casos, visto que os ganhos na qualidade de reconhecimento serão insignificantes se comparados ao esforço e ao tempo gastos na definição.

No modo Definição, um padrão do usuário é criado e pode ser usado ao executar o OCR em todo o texto.

Usando padrões do usuário

Para usar um padrão para reconhecer um documento:

  1. Abra a caixa de diálogo Opções (Ferramentas > Opções…) e clique na guia Ler.
  2. Em Treinamento, selecione a opção Utilize apenas o padrão do usuário.

Observação: se você selecionar Utilize padrões internos e do usuário, o ABBYY FineReader 12 usará os padrões do usuário e os padrões definidos de fábrica para o OCR.

  1. Clique no botão Editor de padrões….
  2. Na caixa de diálogo Editor de padrões, selecione o padrão desejado e clique em OK.
  3. Na janela principal do ABBYY FineReader, clique no botão Ler.

Criando e definindo um padrão do usuário

Para definir um padrão para reconhecer novos caracteres e ligaduras:

  1. Abra a caixa de diálogo Opções (Ferramentas > Opções…) e clique na guia Ler.
  2. Em Treinamento, selecione Utilize padrões internos e do usuário ou Utilize apenas o padrão do usuário.
  3. Selecione a opção Leia com treinamento.
  4. Clique no botão Editor de padrões….

Observação: a definição de padrões não é compatível com os idiomas asiáticos.

  1. Na caixa de diálogo Editor de padrões, clique em Novo…
  2. A caixa de diálogo Criar padrão será aberta. Digite o nome do padrão do usuário e clique em OK.
  3. Feche a caixa de diálogo Editor de padrões e a caixa de diálogo Opções clicando no botão OK de cada uma.
  4. Na barra de ferramentas na parte superior da janela Imagem, clique em Ler.

Caso o ABBYY FineReader encontre um caractere desconhecido, ele será exibido em uma caixa de diálogo Treinamento do padrão.

  1. Ensine o programa a ler novos caracteres e ligaduras.

Uma ligadura é uma combinação de dois ou três caracteres que estão grudados (por exemplo, fi, fl, ffi, etc.), e o programa tem dificuldade para separá-los. De fato, resultados melhores poderão ser obtidos se eles forem tratados como um único caractere composto.

Observação: as palavras impressas em negrito ou em itálico no seu texto ou as palavras em sobrescrito/subscrito podem ser mantidas no texto reconhecido, selecionando as opções correspondentes em Efeitos.

Para retornar a um caractere definido anteriormente, clique no botão Voltar. O quadro retornará ao seu local anterior e a última correspondência "imagem do caractere a caractere do teclado" definida será removida do padrão. O botão Voltar navega entre caracteres de uma palavra e não navegará entre palavras.

Importante!

  • Você pode treinar o ABBYY FineReader para ler os caracteres inclusos no alfabeto do idioma de reconhecimento. Para treinar o programa para ler caracteres que não podem ser digitados no teclado, use uma combinação de dois caracteres para representar esses caracteres inexistentes ou copie o caractere desejado da caixa de diálogo Inserir caractere (clique em   para abrir a caixa de diálogo).
  • Cada padrão pode conter até 1.000 novos caracteres. Entretanto, evite criar muitas ligaduras, visto que isso pode afetar adversamente a qualidade de OCR.

Selecionando um padrão do usuário

O ABBYY FineReader permite o uso de padrões para aprimorar a qualidade de OCR.

  1. No menu Ferramentas, clique em Editor de padrões….
  2. Na caixa de diálogo Editor de padrões, selecione o padrão desejado na lista de padrões disponíveis e clique em Definir como ativo.

Alguns pontos importantes a serem lembrados:

  1. Em vez de diferenciar entre alguns caracteres semelhantes, porém diferentes, o ABBYY FineReader reconhece-os como o mesmo caractere. Por exemplo, as aspas retas ('), para a esquerda (‘) e para a direita (’) serão armazenadas em um padrão como um caractere único (aspas retas). Isso significa que as aspas esquerda e direita nunca serão usadas no texto reconhecido, mesmo se você tentar defini-las.
  2. Para algumas imagens de caracteres, o ABBYY FineReader selecionará o caractere correspondente do teclado, com base no contexto adjacente. Por exemplo, uma imagem de um pequeno círculo será reconhecida como a letra O se houver letras logo depois dela e como o número 0 se houver dígitos depois.
  3. Um padrão pode ser usado somente para documentos que possuem a mesma fonte, tamanho de fonte e resolução que o documento usado para criar o padrão.
  4. Para poder usar um padrão mais tarde, salve-o em um arquivo. Consulte "O que é um documento do FineReader?" para obter detalhes.
  5. Para reconhecer textos definidos com uma fonte diferente, certifique-se de desativar o padrão do usuário, selecionando a opção Utilize apenas padrões internos em Ferramentas > Opções… > Ler.

Editando um padrão do usuário

Talvez você queira editar seu padrão recém-criado antes de ativar o processo do OCR. Um padrão definido incorretamente pode afetar adversamente a qualidade de OCR. Um padrão deve conter apenas caracteres inteiros ou ligaduras. Caracteres com bordas recortadas ou com correspondências de letras incorretas devem ser removidos do padrão.

  1. No menu Ferramentas, clique em Editor de padrões….
  2. A caixa de diálogo Editor de padrões será aberta. Selecione o padrão desejado e clique no botão Editar….
  3. Na caixa de diálogo Padrão do usuário aberta, selecione um caractere e clique no botão Propriedades….

Na caixa de diálogo que abrir:

  • Insira a letra que corresponde ao caractere no campo Caractere
  • Especifique o efeito de fonte desejado (negrito, itálico, sobrescrito e subscrito) no campo Efeito.

Clique no botão Excluir na caixa de diálogo Padrão do usuário para excluir um caractere que foi definido incorretamente.

1/14/2020 5:26:21 PM


Please leave your feedback about this article