Glossário

Download

A

ABBYY Hot Folder é um agente de planejamento que permite aos usuários selecionarem uma pasta com imagens e definir a hora do processamento das imagens nessa pasta. O ABBYY FineReader processará automaticamente as imagens da pasta selecionada.

ABBYY Screenshot Reader é um aplicativo que permite aos usuários criar capturas de tela e reconhecer textos neles.

ADF (Alimentador automático de documentos) é um dispositivo que alimenta automaticamente documentos em um scanner. Um scanner com um ADF pode digitalizar várias páginas sem intervenção manual. O ABBYY FineReader pode trabalhar com documentos de várias páginas.

ADRT (Tecnologia de reconhecimento adaptativo de documentos) é uma tecnologia que aumenta a qualidade de conversão de documentos com várias páginas. Por exemplo, ele pode reconhecer tais elementos estruturais como títulos, cabeçalhos e rodapés, notas de rodapé, numeração de página e assinaturas.

Análise do documento é o processo de identificar a estrutura lógica de um documento e áreas que contêm vários tipos de dados. A análise de documentos pode ser realizada automaticamente ou manualmente.

Área ativa é uma área selecionada em uma imagem que pode ser excluída, movida ou modificada. Para tornar uma área ativa, clique nela. A moldura que envolve uma área ativa é exibida em negrito e possui pequenos quadrados que podem ser arrastados para alterar o tamanho da área.

Área de imagem de fundo é uma área da imagem que contém uma imagem com texto impresso sobre ele.

Área de imagem é uma área da imagem que contém um código de barras. Esse tipo de área pode incluir uma figura real ou qualquer objeto que seja exibido como uma figura (por exemplo, uma seção de texto).

Área de reconhecimento é uma área da imagem que o ABBYY FineReader deve analisar automaticamente.

Área de tabela é uma área de imagem que contém dados em forma tabular. Quando o programa lê este tipo de área, ele desenha separadores verticais e horizontais dentro da área para formar uma tabela. Esta área é então processada como uma tabela no texto de saída.

Área do texto é uma área da imagem que contém um código de barras. Áreas de texto devem conter apenas uma coluna de texto.

Área é uma seção de uma imagem cercada por uma moldura e contendo um determinado tipo de dados. Antes de executar o OCR, o ABBYY FineReader detecta as áreas de texto, figura, tabela e código de barras para determinar quais seções da imagem devem ser reconhecidas e em qual ordem.

Áreas de códigos de barras é uma área da imagem que contém um código de barras.

Ativação é o processo de obtenção de um código especial da ABBYY, que permite ao usuário utilizar sua cópia do produto no modo completo em um determinado computador.

Voltar ao topo

B

Brilho é um parâmetro de imagem que reflete a quantidade de branco em uma imagem. Aumentar o brilho torna a imagem mais "clara". Especificar um valor de brilho adequado aumenta a qualidade do reconhecimento. Veja também: Dicas de digitalização.

C

Cabeçalhos e rodapés são imagens ou texto na margem superior ou inferior de uma página. Cabeçalhos estão localizados na parte superior da página e rodapés estão localizados na parte inferior.

Caracteres de baixa confiabilidade são caracteres que podem ter sido reconhecidos pelo programa incorretamente.

Caracteres ignorados são quaisquer caracteres não letras localizados nas palavras (por exemplo, caracteres silábicos ou marcas de stress). Esses caracteres são ignorados durante a verificação ortográfica.

Caracteres proibidos são caracteres que você acha que nunca irão ocorrer em um texto para ser reconhecido. A especificação desses caracteres aumenta a velocidade e a qualidade do OCR.

Configurações de segurança do PDF são restrições que podem impedir que um documento PDF seja aberto, editado, copiado ou impresso. Essas configurações incluem senhas de abertura de documento, senhas de permissões e níveis de criptografia.

D

dpi (pontos por polegada) é uma medida da resolução da imagem.

Driver é um programa de software que controla um periférico do computador (por exemplo, um scanner, um monitor etc).

Voltar ao topo

E

Efeitos de fonte é a aparência de uma fonte (negrito, itálico, sublinhado, riscado, subscrito, sobrescrito, minúsculas).

Existente é um modelo que contém informações sobre o tamanho e o local das áreas de um conjunto de documentos de aparência semelhante.

F

Fonte monoespaçada é uma fonte (como Courier New) na qual os caracteres são igualmente espaçados. Para melhores resultados de OCR em fontes monoespaçadas, na guia OCR da caixa de diálogo Opções selecione Máquina de escrever na lista suspensa Tipo de documento grupo de opções.

Forma primária é a forma de "dicionário" de uma palavra (mil entradas de entradas do dicionário são geralmente dadas em suas formas primárias).

G

Gerenciador de licenças é um utilitário usado para gerenciar licenças e ativação do ABBYY FineReader ABBYY FineReader PDF Corporate.

H

Hífen opcional é um hífen (¬)  que indica exatamente onde uma palavra ou combinação de palavras deve ser dividida se ocorrer no final de uma linha (por exemplo, "autoformatação" deve ser dividida em "auto–formatação"). O ABBYY FineReader substitui todos os hífens localizados nas palavras dos dicionários por hífens opcionais.

I

ID de suporte é um identificador exclusivo de um número de série que contém informações sobre a licença e o computador no qual ele é usado. Uma ID de suporte fornece proteção adicional e é verificada pela equipe de suporte técnico antes de fornecer suporte técnico.

ID do produto é gerada automaticamente com base na configuração de hardware, ao ativar o ABBYY FineReader em um determinado computador. Ele não contém quaisquer informações pessoais ou informações sobre o software ou os dados armazenados no seu computador.

Imagem invertida é uma imagem com caracteres brancos em um fundo escuro.

Voltar ao topo

L

Layout de página é o arranjo de texto, tabelas, imagens, parágrafos e colunas em uma página. As fontes, tamanhos de fonte, cores de fonte, plano de fundo do texto e orientação de texto também fazem parte do layout da página.

Ligadura é uma combinação de dois ou mais caracteres que estão "grudados" (por exemplo, fi, fl, ffi). Tais caracteres são difíceis de separar para o ABBYY FineReader. Tratá-los como um único caractere composto melhora a precisão do OCR.

M

Menu de atalho é o menu que aparece quando você clique em algo, como uma área ou outra parte de um documento.

Modo de cor determina se as cores do documento devem ser mantidas. Imagens em preto e branco produzem projetos menores de OCR e são mais rápidas para o processo.

Modo de digitalização é um parâmetro de digitalização que determina se uma imagem deve ser digitalizada em preto-e-branco, em escala de cinzas ou em cores.

N

Número de série é um número exclusivo fornecido na compra o programa. É usado durante a ativação.

O

O treinamento é o processo de estabelecimento de uma correspondência entre uma imagem do caractere ele próprio. Veja também: Se o documento impresso contiver fontes fora do padrão.

OCR (Reconhecimento óptico de caracteres) é uma tecnologia que permite aos computadores ler o texto, detectar imagens, tabelas e outros elementos de formatação.

Opções de projeto OCR é o conjunto de opções que podem ser selecionadas na Opções (clique em Ferramentas > Opções... para abrir esta caixa de diálogo). Essas opções incluem também padrões e idiomas de usuário. Opções de projeto OCR podem ser salvas e em seguida, usadas em outros projetos OCR.

Voltar ao topo

P

Padrão é um conjunto de associações entre imagens do caractere em média e seus respectivos nomes. Os padrões são criados quando você treina o ABBYY FineReader sobre um texto específico.

Página de código é uma tabela que estabelece correspondências entre caracteres e seus códigos. Os usuários podem selecionar os caracteres necessários nessa página de código.

Palavra composta é uma palavra formada de duas ou mais palavras existentes. No ABBYY FineReader, uma palavra composta é aquela que o programa não pode encontrar em seu dicionário, mas que pode criar a partir de duas ou mais palavras de dicionário.

Palavras de baixa confiabilidade são palavras que contêm um ou mais caracteres de baixa confiabilidade.

Paradigma é o conjunto de todas as formas gramaticais de uma palavra.

PDF (Portable Document Format) é um formato de documento comum. Um arquivo PDF é igual a não importa em qual computador seja exibido, graças a descrições detalhadas do texto, fontes e gráficos nele contidos.

PDF com tags é um documento PDF que contém informações sobre a estrutura do documento, tais como suas partes lógicas, imagens e tabelas. A estrutura de um documento é codificada em tags de PDF. Um arquivo PDF com tags pode ter layout fluido para se adaptar a diferentes tamanhos de tela e ser exibido em dispositivos portáteis.

Projeto OCR é um projeto criado pelo ABBYY FineReader para processar um documento. Contém as imagens das páginas do documento, o texto reconhecido (se houver) e as configurações do programa.

Voltar ao topo

R

Resolução é um parâmetro de digitalização medido em pontos por polegada (dpi). A resolução de 300 dpi deve ser usada para textos em fontes 10 pt e maior, 400 a 600 dpi é preferível para textos de tamanhos de fonte menores (9 pt e menos).

S

Scanner é um dispositivo de inserção de imagens em um computador.

Senha de permissões é uma senha que impede que os usuários abram um documento PDF, a menos que seja digitada a senha especificada pelo autor. Se algumas configurações de segurança forem selecionadas para o documento, os usuários não poderão alterar essas configurações até que digitem a senha especificada pelo autor.

Senha para abrir o documento é uma senha que impede que os usuários abram um documento PDF, a menos que seja digitada a senha especificada pelo autor.

Separadores são símbolos que podem separar palavras (por exemplo, /, \, traços) e que são separados das palavras por espaços.

Sigla éuma forma abreviada de uma palavra ou frase (por exemplo, MS-DOS para Microsoft Disk Operating System, UN para Nações Unidas etc.

Sistema Omnifont é um sistema que reconhece caracteres definidos em qualquer fonte e tamanho de fonte sem uma definição anterior.

T

Tarefa automatizada: Um componente de gerenciamento de tarefas do ABBYY FineReader PDF que permite criar, configurar e iniciar tarefas do ABBYY FineReader.

Tarefa do ABBYY FineReader é um conjunto de etapas consecutivas que o programa precisa realizar para processar um documento. ABBYY FineReader PDF inclui uma série de tarefas internas para as necessidades mais comuns de processamento. Os usuários também podem criar suas tarefas personalizadas. Tarefas incorporadas podem ser inicializadas na janela Nova Tarefa.

Teclas de atalho são teclas ou combinações de teclas que desencadeiam uma ação específica quando pressionado. Usar teclas de acesso rápido pode aumentar significativamente a sua produtividade.

Tipo de documento é um parâmetro que informa o programa como o texto original foi impressa (por exemplo, em uma impressora de laser, em uma máquina de escrever etc.). Para textos de impressão a laser, selecione Automático, para textos datilografados, selecione Máquina de escrever, para aparelhos de fax, selecione Fax.

U

Unicode é um texto internacional padrão de codificação desenvolvido pelo consórcio Unicode (Unicode, Inc.). O padrão Unicode fornece um sistema de 16 bits facilmente extensível para codificação de símbolos de quase todas os idiomas modernos. Especifica como os símbolos devem ser codificados e determina quais algoritmos e propriedades de caractere devem ser usadas durante o processo de codificação.

Voltar ao topo

17.05.2023 7:35:06

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.