- English (English)
- Bulgarian (Български)
- Chinese Simplified (简体中文)
- Chinese Traditional (繁體中文)
- Czech (Čeština)
- Danish (Dansk)
- Dutch (Nederlands)
- French (Français)
- German (Deutsch)
- Greek (Ελληνικά)
- Hungarian (Magyar)
- Italian (Italiano)
- Japanese (日本語)
- Korean (한국어)
- Polish (Polski)
- Portuguese (Brazilian) (Português (Brasil))
- Slovak (Slovenský)
- Spanish (Español)
- Swedish (Svenska)
- Turkish (Türkçe)
- Vietnamese (Tiếng Việt)
Параметри розпізнавання
Правильно встановлені параметри розпізнавання допоможуть вам швидко отримати якісний документ, придатний для подальшого редагування. Вибір параметрів залежить не тільки від обсягу та складності вихідного документа, але й від того, як ви плануєте використовувати розпізнаний документ надалі. Ви можете вказати такі параметри:
- Режими розпізнавання PDF
- швидкість і якість розпізнавання
- тип документа
- елементи оформлення документа, які буде визначати програма
- чи шукати штрих-коди на зображенні
- еталони та мови
- шрифти, які будуть використовуватися
Вибрати потрібні параметри ви можете на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).
Розпізнавання сторінок, доданих у документ, виконується в автоматичному режимі з поточними налаштуваннями програми. Ви можете вимкнути автоматичний аналіз і розпізнавання доданих зображень на закладці Обробка зображень діалогу Налаштування (меню Інструменти > Налаштування...).
Якщо ви змінили мову розпізнавання, виділили зони на зображенні вручну або змінили інші налаштування програми, виконайте розпізнавання заново.
Результати розпізнавання PDF-документів залежать від правильно вибраного режиму.
Ці налаштування призначені для обробки звичайного PDF-документа, що містить текстовий шар й ілюстрації. PDF-документи такого типу отримуються під час конвертування в PDF-формат файлів, що редагуються. Інші типи PDF-документів, як-от PDF-документ із можливістю пошуку та PDF (тільки зображення), завжди обробляються в режимі Використовувати OCR, встановленому за замовчуванням для документів цих типів. Їх обробка не потребує додаткових налаштувань.
У програмі передбачені три режими розпізнавання PDF-документів:
- Автоматично визначати: використовувати OCR або текст із PDF
При використанні цього режиму програма визначає якість текстового шару. Коли якість текстового шару хороша, використовується цей текстовий шар, в іншому разі створюється текстовий шар, отриманий у результаті розпізнавання. - Використовувати OCR
Під час використання цього режиму текстовий шар створюється в результаті розпізнавання.
Порівняно з іншими режимами потребує більше часу, але забезпечує кращу якість розпізнавання в документах із неякісним текстовим шаром. - Використовувати тільки текст з PDF
Цей режим використовується для обробки документів, що містять текстовий шар. При використанні цього режиму текст береться з PDF-документа без розпізнавання.
Швидкість і якість розпізнавання
В ABBYY FineReader PDF передбачено:
- Ретельне розпізнавання
Цей режим придатний для розпізнавання як простих, так і складних документів. Наприклад, для документів, що містять текст на кольоровому фоні, або для документів, що містять таблиці, зокрема й таблиці без ліній сітки та таблиці з кольоровими клітинками.
Порівняно зі Швидким Ретельне розпізнавання потребує більше часу, проте забезпечує кращу якість розпізнавання. - Швидке розпізнавання
Цей режим рекомендується для обробки великих обсягів документів із простим оформленням і хорошою якістю друку.
Дозволяє вказати, на якому пристрої надруковано документ. Див. також «Як урахувати характеристики вихідного документа».
Визначення елементів оформлення
Вкажіть елементи оформлення документа, які визначатиме програма: колонтитули, зміст, нумеровані списки, виноски. Вибрані елементи оформлення буде збережено як інтерактивні елементи, а не як основний текст.
Якщо ваш документ містить штрих-код і ви хочете передати його не зображенням, а перевести його в послідовність літер і цифр, виберіть опцію Конвертувати штрих-коди у рядки. За замовчуванням цю опцію вимкнено.
Навчання розпізнаванню нових символів і лігатур використовується для розпізнавання таких текстів:
- Для набору яких використані декоративні шрифти
- У яких трапляються спеціальні символи (наприклад, окремі математичні символи)
- Великого обсягу (більше 100 сторінок) тексту поганої якості
За замовчуванням опція навчання вимкнена. Для того щоб у процесі розпізнавання відбувалось навчання невідомих символів, позначте опцію Навчати розпізнаванню нових символів та лігатур.
Під час розпізнавання ви можете використовувати вбудовані еталони або створити власний еталон. Для цього виберіть потрібну опцію в групі.
Ви можете зберегти налаштування еталонів і мов користувача або завантажити раніше збережені. Див. також «OCR-проект».
Виберіть шрифти, які буде використано під час збереження розпізнаного тексту.
Щоб вибрати шрифти:
- Натисніть кнопку Шрифти...
- Позначте потрібні шрифти та натисніть ОК.
12.06.2024 14:31:57