Якщо у вихідному документі є декоративні (нестандартні) шрифти

Якщо у вашому документі використовуються декоративні шрифти або трапляються спеціальні символи (наприклад, окремі математичні символи), для поліпшення якості розпізнавання рекомендується використовувати режим Розпізнавання з навчанням.

Примітка. В інших випадках розпізнавання з навчанням використовувати не рекомендується, оскільки витрати на навчання будуть перевищувати отриманий виграш якості розпізнавання.

У результаті навчання створюється еталон літер, що зустрічаються в тексті. Цей еталон у подальшому використовується під час розпізнавання основного обсягу тексту.

Використання еталона користувача

Як розпізнати документ, використовуючи еталон користувача:

  1. Відкрийте діалог Налаштування (меню Сервіс>Налаштування…) на закладці Розпізнати.
  2. У групі Навчання встановіть перемикач у положення Використовувати тільки еталони користувача.

Примітка. Якщо на цій закладці відзначити опцію Використовувати вбудовані еталони та еталони користувача, то в процесі розпізнавання програма буде використовувати як користувацькі, так і вбудовані еталони.

  1. Натисніть кнопку Редактор еталонів….
  2. У діалозі Редактор еталонів, що відкрився, виберіть еталон для роботи і закрийте діалог.
  3. У головному вікні ABBYY FineReader натисніть кнопку Розпізнати.

Створення і навчання еталона

Щоб навчити еталон символів або лігатур:

  1. Відкрийте діалог Налаштування (меню Сервіс>Налаштування…) на закладці Розпізнати.
  2. У групі Навчання встановіть перемикач у положення Використовувати вбудовані еталони та еталони користувача або Використовувати тільки еталони користувача.
  3. Відмітьте опцію Розпізнавання з навчанням.
  4. Натисніть кнопку Редактор еталонів…

Примітка. Для азіатських мов навчання еталонів користувача не підтримується.

  1. У діалозі Редактор еталонів, що відкрився, натисніть кнопку Новий…
  2. У діалозі Створити еталон , що відкрився, введіть ім’я еталона й натисніть ОК.
  3. Натисніть кнопку ОК у діалозі Редактор еталонів, потім кнопку ОК у діалозі Налаштування.
  4. У вікні Зображення натисніть кнопку Розпізнати.

Якщо в процесі розпізнавання зустрінеться невідомий символ, відкриється діалог Додавання шаблону із зображенням цього символу.

  1. Навчіть еталон символів або лігатур.

Лігатури — це поєднання двох чи трьох символів, які через особливості їхнього накреслення неможливо розділити під час навчання і які одразу навчаються як комбінація символів. Навчання лігатур відбувається так само, як і додавання окремих символів.

Примітка. Якщо вам важливо у розпізнаваному тексті зберегти зображення шрифту, верхній або нижній індекси, виберіть відповідні опції в групі Ефекти.

У процесі навчання ви можете повернутися до редагування попереднього символу. Для цього натисніть кнопку Назад. У цьому випадку охоплювальний прямокутник повернеться на попередню позицію, а останню створену пару «зображення — символ» буде вилучено з еталона. Кнопка Назад діє в межах одного слова.

Увага!

  • Навчання можливе тільки для символів, що входять до алфавіту мови. Якщо ви навчаєте програму символів, які не можна ввести з клавіатури, то для їхнього позначення можна використовувати комбінації з двох символів, або ви можете скопіювати необхідний символ з Вставити символ (відкривається після натискання кнопки ).
  • В одному еталоні може міститися до 1000 нових символів. Однак не слід створювати занадто багато лігатур, тому що це може негативно позначитися на якості розпізнавання.

Вибір еталона для роботи

Програма ABBYY FineReader дозволяє використовувати еталони для якіснішого розпізнавання документів.

  1. У меню Сервіс виберіть пункт Редактор еталонів….
  2. У діалозі Редактор еталонів, що відкрився, зі списку існуючих еталонів виберіть потрібний і натисніть кнопку Вибрати.

Під час роботи з еталонами існують такі особливості:

  1. Зображення деяких символів не розрізняються системою розпізнавання і зіставляються з якимось одним символом. Наприклад, прямий ('), лівий (‘) і правий (’) апострофи зберігаються в еталоні як зображення прямого апострофа. Таким чином, після розпізнавання в тексті ніколи не з’явиться правий чи лівий апостроф, хоча під час навчання були вказані саме ці символи.
  2. Для деяких зображень рішення про те, яким символом у розпізнаному тексті його зіставити, приймається на основі загального аналізу розпізнаного тексту. Так, наприклад, рішення про те, чи є символ, що позначається «кружечком» , літерою «о» чи цифрою нуль, система приймає залежно від того, чи знаходяться поруч інші цифри або літери.
  3. Створений еталон можна використовувати тільки для розпізнавання текстів, які використовують ті самі шрифт і розмір шрифту і які відскановано з тією ж роздільною здатністю, що й документ, на якому цей еталон створювався.
  4. Ви можете зберегти створений еталон для роботи з іншими документами ABBYY FineReader. Для цього збережіть файл еталонів і мов. Докладніше див. «Документ FineReader».
  5. Під час переходу до розпізнавання текстів, надрукованих іншим шрифтом, не забудьте відключити еталон. Для цього на закладці Розпізнати діалогу Налаштування (меню Сервіс>Налаштування…) встановіть перемикач у положення Використовувати тільки вбудовані еталони.

Редагування еталона

Перш ніж запускати розпізнавання із щойно створеним еталоном, рекомендується переглянути еталон і, якщо буде потрібно, відредагувати його. Цим ви зведете до мінімуму помилки розпізнавання, які можуть виникнути через неправильно навчений еталон. Еталон має містити тільки цілі символи або лігатури. Символи, обрізані з країв, і символи з неправильними літерними відповідниками слід видалити з еталона.

  1. У меню Сервіс виберіть пункт Редактор еталонів….
  2. У діалозі Редактор еталонів, що відкрився, виберіть потрібний еталон і натисніть кнопку Редагувати….
  3. У діалозі Шаблон користувача, що відкрився, виберіть символ і натисніть кнопку Параметри.

У діалозі, що відкрився:

  • У полі Символ введіть літеру, яка відповідає символу;
  • У полі Ефекти вкажіть правильне накреслення: курсив, напівжирний, верхній або нижній індекси.

Щоб видалити неправильно навчені символи натисніть кнопку Видалити у діалозі Шаблон користувача.

14.01.2020 17:26:22


Please leave your feedback about this article