Якщо частину символів не вдалося розпізнати

У процесі роботи програма спирається на знання про мову, зазначену як мову документа. Якщо в документі багато неприродних конструкцій, наприклад, артикулів, може виявитися, що мова розпізнавання не містить частину символів, що використовуються в тексті. У цьому випадку виникають помилки. Перед розпізнаванням подібного документа необхідно створити нову мову, яка буде містити всі використовувані в тексті символи. Ви так само можете об’єднати існуючі мови в нову групу і під час розпізнавання підключити саме їх.

Як створити нову мову

  1. У меню Сервіс виберіть пункт Редактор мов…
  2. У діалозі Редактор мов натисніть кнопку Новий…
  3. У діалозі, що відкрився, встановіть перемикач у положення Створити нову мову на підставі наявної, виберіть мову, на основі якої ви створюєте нову, і натисніть кнопку ОК.
  4. Відкриється діалог Властивості мови. У цьому діалозі визначте всі необхідні параметри:
    1. Ім’я нової мови.
    2. У полі Базова мова вказано мову, на основі якої ви створюєте нову мову. У цьому полі відображається мова, яку ви обрали в діалозі Властивості мови. У спадному списку ви можете вибрати іншу мову.
    3. Абетка мови зазначено алфавіт мови, на основі якої ви створюєте нову мову. Натисніть кнопку , щоб відредагувати алфавіт.
    4. Словник, який буде використовуватися системою для розпізнавання та перевірки розпізнаного тексту. Можливі такі варіанти:
      • Ні

Не підключати словник до мови.

  • Вбудований словник

Використовується словник, що поставляється з програмою.

  • Словник користувача

Щоб наповнити словник або підключити старий словник користувача або текстовий файл у ANSI-кодуванні (слова повинні бути розділені пробілами або іншими символами, не включеними до алфавіту), натисніть кнопку Властивості…

Примітка. Під час перевірки орфографії словникові слова мови користувача не виділяються, якщо в тексті вони зустрілися в тому вигляді, в якому вони задані в словнику, або в стандартному вигляді: всіма маленькими, всіма великими літерами, з великої літери.

Вигляд слова у словнику Допустимі варіанти написання слова в тексті
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
  • Регулярний вираз

Ви можете створити словник мови користувача, використовуючи регулярні вирази.

Докладніше див. у статті «Регулярні вирази».

  1. Ви можете вказати додаткові властивості мови. Для цього натисніть кнопку Додатково…

У діалозі Додаткові властивості мови ви можете вказати:

  • Символи, які можуть зустрічатися на початку або в кінці слова
  • Нелітерні символи, які пишуться окремо від слів
  • Вказати ігноровані символи, які можуть зустрічатися всередині слова
  • Символи, які напевне не можуть зустрічатися в текстах, які розпізнаються з підключенням цієї мови (заборонені символи)
  • Опцію Текст може містити арабські та римські цифри і абревіатури
  1. Після того, як мову створено, виберіть її для розпізнавання.

Докладніше про вибір мови див. у статті «Мови документа».

Стандартно мову користувача буде збережено в папку документа FineReader. Ви також можете зберегти всі мови та еталони в один файл у групі Еталони і мови користувача на закладці Розпізнати діалогу Налаштування (меню Сервіс>Налаштування…).

Як створити нову групу мов

Якщо під час розпізнавання текстів ви часто використовуєте деяке сполучення мов, для зручності можна об’єднати ці мови в групу.

  1. У меню Сервіс виберіть пункт Редактор мов….
  2. У діалозі Редактор мов, що відкрився, натисніть кнопку Новий….
  3. У діалозі Нова мова або група мов, що відкрився, виберіть пункт Створити нову групу мов і натисніть ОК.
  4. Відкриється діалог Властивості групи мов.

У цьому діалозі задайте ім’я групи і виберіть підключені мови.

Примітка. Ви можете вказати символи, які напевне не зустрічаються в розпізнаваному документі. Вказання таких символів може суттєво збільшити швидкість і надійність розпізнавання. Для цього у діалозі Властивості групи мов натисніть кнопку Додатково… і в діалозі Додаткові властивості групи мов введіть відповідні символи в поле Вилучені з розпізнавання символи.

  1. Натисніть кнопку ОК.

Створена група з’явиться у спадному списку Мови документа на головній панелі інструментів.

Стандартно групу мов користувача буде збережено в папку документа FineReader. Ви також можете зберегти всі мови та еталони в один файл у групі Еталони і мови користувача на закладці Розпізнати діалогу Налаштування (меню Сервіс>Налаштування…).

Порада. Комбінацію мов ви можете вказати безпосередньо у спадному списку мов вікна Сторінки.

  1. У спадному списку Мови документа виберіть пункт Інші мови….
  2. У діалозі Редактор мов, що відкрився, позначте пункт Вказати мови розпізнавання вручну.
  3. Виберіть потрібні мови й натисніть кнопку Скасувати.

14.01.2020 17:26:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.