Se o programa falhar em reconhecer determinados caracteres

ABBYY FineReader 14 usa dados sobre o idioma do documento ao reconhecer textos. O programa pode falhar em reconhecer alguns caracteres nos documentos que possuem elementos incomuns (ex. números de código) porque o idioma do documento pode não conter tais caracteres. Para reconhecer tais documentos, você pode criar um idioma personalizado que tenha todos os caracteres necessários. Você também pode criar grupos de vários idiomas OCR e usar esses grupos ao reconhecer documentos.

Como criar um idioma do usuário

  1. Abra a Opções caixa de diálogo (clique em Ferramentas > Opções... para abrir esta caixa de diálogo), clique na Idiomas guia.
  2. Clique no Novo... botão.
  3. a caixa de diálogo que se abre, selecione a Criar um novo idioma com base em um idioma existente opção, selecione o idioma que deseja usar como base para o novo idioma e clique OK.
  4. A Propriedades do idioma caixa de diálogo será aberta. Nesta caixa de diálogo:
    1. Digite um nome para o seu novo idioma.
    2. O idioma selecionado na Novo idioma ou grupo caixa de diálogo é exibido na Idioma de origem lista suspensa . Você pode selecionar um idioma diferente nessa lista suspensa.
    3. O Alfabeto Contém o alfabeto do idioma base. Se desejar editar o alfabeto, clique no botão.
    4. O grupo de opção de Dicionário contém várias opções para o dicionário que será usado pelo programa ao reconhecer texto e verificar o resultado:
      • Nenhum
        O idioma não terá um dicionário.
      • Dicionário interno
        O dicionário embutido do probrama será usado.
      • Dicionário do usuário
        Clique  Editar... botão para especificar os termos do dicionário ou importar um dicionário personalizado existente ou um arquivo de texto com codificação Windoes-1252 (termos devem estar separados por espaços ou outros caracteres que não estejam no alfabeto).
        As palavras do dicionário do usuário não serão marcadas como má ortografia quando a verificação ortográfica for feita no texto reconhecido. Elas podem ser escritas em minúsculas ou maiúsculas, ou podem ter apenas a primeira letra maiúscula.
Palavra no dicionário Palavras que não são consideradas como erro de ortografia durante a verificação ortográfica
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • O Expressão regular permite criar um dicionário de usuário usando expressões regulares.
    Veja também: Expressões regulares.
  1. Idiomas podem ter várias propriedades adicionais. Para alterar essas propriedades, clique no Avançado... botão para abrir a Propriedades avançadas do idioma caixa de diálogo onde você pode especificar:
    • Caracteres que iniciam ou terminam uma palavra
    • Caracteres diferentes de letras que aparecem separado das palavras
    • Caracteres que podem aparecer dentro das palavras, mas devem ser ignorados
    • Caracteres que não devem aparecer em textos reconhecidos usando este idioma (caracteres proibidos)
    • A O texto pode conter algarismos arábicos, algarismos romanos, e abreviações opção
  2. Você pode agora selecionar o novo idioma recém-criado ao escolher os idiomas OCR.
    Para mais idiomas OCR, consulte Idiomas OCR.

Por padrão, o idioma do usuário é salvo na pasta do projeto OCR. Você também pode salvar todos os padrões do usuário e idiomas como um único arquivo. Para isso, abra a Opções caixa de diálogo (clique emFerramentas > Opções... para abrir esta caixa de diálogo), clique na OCR e depois clique no botão Salvar Padrões e Idiomas... botão.

Criando um grupo de idiomas

Se estiver usando uma combinação particular de idiomas com frequência, pode criar um grupo de idiomas, para maior conveniência.

  1. Abra a caixa de diálogo Opções caixa de diálogo (clique em Ferramentas > Opções... para abrir esta caixa de diálogo), clique na Idiomas guia.
  2. Clique no Novo... botão.
  3. Na Novo idioma ou grupo caixa de diálogo, selecione a Criar um novo grupo de idiomas opção e clique em OK.
  4. A Propriedades do grupo de idiomas caixa de diálogo será aberta. Nessa caixa de diálogo, especifique um nome para o grupo de idiomas e selecione os idiomas que deseja incluir no grupo.
    Se você souber que o seu texto não conterá determinados caracteres, talvez você deseje especificar de forma explícita os caracteres designados como proibidos. Fazer isso aumenta a velocidade e precisão do OCR. Para especificar esses caracteres, clique no Avançado... botão na Propriedades do grupo de idiomas caixa de diálogo e digite os caracteres proibidos no Caracteres proibidos campo.
  5. Clique OK.

O novo grupo será exibido na lista suspensa de idiomas na barra de ferramentas principal.

Por padrão, os grupos de idioma do usuário são salvos na pasta do Projeto OCR. Você também pode salvar todos os padrões do usuário e idiomas como um único arquivo. Para isso, abra a Opções caixa de diálogo (clique em Ferramentas > Opções... para abrir esta caixa de diálogo), clique na OCR guia e depois clique em Salvar Padrões e Idiomas... botão.

Dica. Você pode usar a lista suspensa de idiomas na barra de ferramentas principal para selecionar um grupo de idiomas.

  1. Selecione Mais idiomas... na lista suspensa de idiomas na barra de ferramentas principal.
  2. Na Editor de idiomas caixa de diálogo, selecione a Especificar os idiomas de OCR manualmente a opção.
  3. Selecione os idiomas desejados e clique em OK.

02.11.2018 16:19:50


Please leave your feedback about this article