Параметри розпізнавання

Правильно встановлені параметри розпізнавання допоможуть вам швидко отримати якісний документ, придатний для подальшого редагування. Вибір параметрів залежить не тільки від обсягу та складності вихідного документа, але й від того, як ви плануєте використовувати розпізнаний документ надалі. Ви можете вказати такі параметри:

Вибрати потрібні параметри ви можете на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).

Розпізнавання сторінок, доданих у документ, виконується в автоматичному режимі з поточними налаштуваннями програми. Ви можете вимкнути автоматичний аналіз і розпізнавання доданих зображень на закладці Обробка зображень діалогу Налаштування (меню Інструменти > Налаштування...).

Якщо ви змінили мову розпізнавання, виділили зони на зображенні вручну або змінили інші налаштування програми, виконайте розпізнавання заново.

Режими розпізнавання PDF

Результати розпізнавання PDF-документів залежать від правильно вибраного режиму.

Ці налаштування призначені для обробки звичайного PDF-документа, що містить текстовий шар й ілюстрації. PDF-документи такого типу отримуються під час конвертування в PDF-формат файлів, що редагуються. Інші типи PDF-документів, як-от PDF-документ із можливістю пошуку та PDF (тільки зображення), завжди обробляються в режимі Використовувати OCR, встановленому за замовчуванням для документів цих типів. Їх обробка не потребує додаткових налаштувань.

У програмі передбачені три режими розпізнавання PDF-документів:

    • Автоматично визначати: використовувати OCR або текст із PDF
      При використанні цього режиму програма визначає якість текстового шару. Коли якість текстового шару хороша, використовується цей текстовий шар, в іншому разі створюється текстовий шар, отриманий у результаті розпізнавання.
    • Використовувати OCR
      Під час використання цього режиму текстовий шар створюється в результаті розпізнавання.
      Порівняно з іншими режимами потребує більше часу, але забезпечує кращу якість розпізнавання в документах із неякісним текстовим шаром.
    • Використовувати тільки текст з PDF
      Цей режим використовується для обробки документів, що містять текстовий шар. При використанні цього режиму текст береться з PDF-документа без розпізнавання.

Швидкість і якість розпізнавання

В ABBYY FineReader 14 передбачено:

  • Ретельне розпізнавання
    Цей режим придатний для розпізнавання як простих, так і складних документів. Наприклад, для документів, що містять текст на кольоровому фоні, або для документів, що містять таблиці, зокрема й таблиці без ліній сітки та таблиці з кольоровими клітинками.
    Порівняно зі Швидким Ретельне розпізнавання потребує більше часу, проте забезпечує кращу якість розпізнавання.
  • Швидке розпізнавання
    Цей режим рекомендується для обробки великих обсягів документів із простим оформленням і хорошою якістю друку.

Тип документа

Дозволяє вказати, на якому пристрої надруковано документ. Див. також «Як урахувати характеристики вихідного документа».

Визначення елементів оформлення

Вкажіть елементи оформлення документа, які визначатиме програма: колонтитули, зміст, нумеровані списки, виноски. Вибрані елементи оформлення буде збережено як інтерактивні елементи, а не як основний текст.

Штрих-коди

Якщо ваш документ містить штрих-код і ви хочете передати його не зображенням, а перевести його в послідовність літер і цифр, виберіть опцію Конвертувати штрих-коди у рядки. За замовчуванням цю опцію вимкнено.

Еталони та мови

Навчання розпізнаванню нових символів і лігатур використовується для розпізнавання таких текстів:

  • Для набору яких використані декоративні шрифти
  • У яких трапляються спеціальні символи (наприклад, окремі математичні символи)
  • Великого обсягу (більше 100 сторінок) тексту поганої якості

За замовчуванням опція навчання вимкнена. Для того щоб у процесі розпізнавання відбувалось навчання невідомих символів, позначте опцію Навчати розпізнаванню нових символів та лігатур.

Під час розпізнавання ви можете використовувати вбудовані еталони або створити власний еталон. Для цього виберіть потрібну опцію в групі.

Ви можете зберегти налаштування еталонів і мов користувача або завантажити раніше збережені. Див. також «OCR-проект».

Шрифти

Виберіть шрифти, які буде використано під час збереження розпізнаного тексту.

Щоб вибрати шрифти:

  1. Натисніть кнопку Шрифти...
  2. Позначте потрібні шрифти та натисніть ОК.

11/2/2018 4:20:06 PM


Please leave your feedback about this article