Як врахувати характеристики вихідного документа

Якість розпізнавання багато в чому залежить від якості вихідного зображення. У цій статті ви дізнаєтеся про те, на що слід звернути увагу до розпізнавання документа:


Мови документа

ABBYY FineReader підтримує розпізнавання як одномовних, так і багатомовних, наприклад, англійсько-французьких, документів. Для розпізнавання багатомовних документів необхідно вибрати декілька мов розпізнавання.

Щоб вибрати мови для розпізнавання, у спадному списку Мови документа на головній панелі інструментів (або у вікні Завдання — якщо ви використовуєте для розпізнавання вбудовані завдання) виберіть один із пунктів:

  • Autoselect

Мова буде вибиратися автоматично із заданого списку словникових мов. Ви можете змінити склад цього списку. Для цього:

  1. Натисніть посилання Інші мови… У результаті відкриється діалог Редактор мов.
  2. Переконайтеся, що опцію Автоматично вибирати мову розпізнавання зі списку увімкнено.
  3. Натисніть кнопку Вказати….
  4. У діалозі Мови позначте потрібні мови.
  • Мова або поєднання мов

Виберіть один із запропонованих варіантів. Список мов містить останні використані мови розпізнавання, а також англійську, німецьку та французьку мови.

  • Інші мови…

Виберіть цей пункт, якщо ви хочете вибрати інші мови для розпізнавання.

У діалозі Редактор мов, що відкрився позначте опцію Вказати мови розпізнавання вручну і вкажіть одну або декілька мов. Для цього відмітьте пункти з відповідними назвами мов. Якщо ви часто використовуєте якусь комбінацію мов, то створіть нову групу, яка міститиме ці мови.

Якщо потрібної мови немає у списку, можливо:

  1. Ця мова не підтримується системою ABBYY FineReader.

Повний список мов подано у розділі «Підтримувані мови розпізнавання».

  1. Мова не підтримується вашою копією програми.

Повний перелік доступних вам мов наведено у діалозі Ліцензії (Довідка > Про програму… > Інформація про ліцензії).

У процесі розпізнавання можна використовувати не тільки існуючі мови і групи мов, але й створити нову мову або об’єднати існуючі мови в нову групу і під час розпізнавання підключити саме їх. Докладніше див. «Якщо частину символів не вдалося розпізнати».

Тип друку

Документ може бути надруковано на різних пристроях, наприклад, на друкарській машинці або факсимільному апараті. Якість розпізнавання таких документів може бути різною. Можна домогтися вищої якості розпізнавання, встановивши відповідний Тип друку в діалозі Налаштування.

Для більшості текстів тип друку визначається автоматично. Цьому відповідає значення Авто, встановлене в групі Тип документа в діалозі Налаштування (меню Сервіс>Налаштування…>закладка Документ). При цьому ви можете обробляти документ у кольоровому або чорно-білому режимі.

За потреби ви можете вибрати інший тип друку в цій групі.

Фрагмент сторінки, надрукованої на друкарській машинці. Ширина літер однакова (порівняйте, наприклад, літери «w» і «t»). Для таких текстів встановіть значення Друкарська машинка.
Фрагмент сторінки, видрукуваної на факсимільному апараті. Штрихи літер подекуди не надруковані, є шуми і викривлення літер. Для таких текстів встановіть значення Факс.

Після розпізнавання текстів, надрукованих на друкарській машинці або факсі, не забудьте знову вибрати значення Авто під час повернення до друкарського тексту.

Якість друку

Для успішного розпізнавання документа, надрукованого з поганою якістю, може знадобитися змінити налаштування сканування. Такий документ може містити багато «сміття», нечіткі межі літер, кутасті, нерівні літери з дефектами, перекіс рядків, зсув і неявні межі чорних розділювачів таблиць.

Факс Газетна сторінка

Подібні документи рекомендується сканувати у відтінках сірого. У такому разі вам не потрібно буде підбирати яскравість сканування, програма зробить це за вас автоматично.

Сканування у відтінках сірого забезпечує вищий ступінь збереження інформації про літери сканованого тексту. Це призводить до поліпшення якості розпізнавання документів середньої та низької якості друку. Ви також можете усунути деякі дефекти вручну, використовуючи інструменти з обробки зображення у вікні редактора зображень. Докладніше див. у статті «Обробка зображень».

Колірне оформлення документа

Якщо під час розпізнавання документів немає потреби зберігати кольорові ілюстрації та колірне оформлення документа, ви можете обробляти документ у чорно-білому режимі. Це дозволить суттєво зменшити розмір документа FineReader та скоротити час на розпізнавання. Однак у деяких випадках для зображень із низькою контрастністю можливе погіршення якості розпізнавання. Не рекомендується обробляти в чорно-білому режимі фотографії, журнальні сторінки і документи, які написано ієрогліфічними мовами.

Порада. Ви також можете скоротити час обробки кольорових і чорно-білих документів, вибравши Швидке розпізнавання на закладці Розпізнати діалогу Налаштування. Докладніше про режими розпізнавання див. у статті «Параметри розпізнавання».

Ви можете задати колірний режим документа одним зі способів:

  • У спадному списку Кольоровий режим вікна Завдання або
  • У групі Кольоровий режим на закладці Документ у діалозі Налаштування (меню Сервіс>Налаштування…).

Увага! Після вибору чорно-білого режиму відновити колірне оформлення документа не вдасться. Щоб отримати кольоровий документ, відкрийте файл, що містить кольорові зображення сторінки, або заново відскануйте паперовий документ у кольоровому режимі.

1/14/2020 5:26:22 PM


Please leave your feedback about this article