Якщо частину символів не вдалося розпізнати

У процесі роботи програма спирається на знання про мову, зазначену як мову документа. Якщо в документі багато неприродних конструкцій, наприклад, артикулів, може виявитися, що мова розпізнавання не містить частину символів, що використовуються в тексті. У цьому випадку виникають помилки. Перед розпізнаванням подібного документа необхідно створити нову мову, яка буде містити всі використовувані в тексті символи. Ви так само можете об’єднати існуючі мови в нову групу і під час розпізнавання підключити саме їх.

Як створити нову мову

  1. У меню Сервіс виберіть пункт Редактор мов…
  2. У діалозі Редактор мов натисніть кнопку Новий…
  3. У діалозі, що відкрився, встановіть перемикач у положення Створити нову мову на підставі наявної, виберіть мову, на основі якої ви створюєте нову, і натисніть кнопку ОК.
  4. Відкриється діалог Властивості мови. У цьому діалозі визначте всі необхідні параметри:
    1. Ім’я нової мови.
    2. У полі Базова мова вказано мову, на основі якої ви створюєте нову мову. У цьому полі відображається мова, яку ви обрали в діалозі Властивості мови. У спадному списку ви можете вибрати іншу мову.
    3. Абетка мови зазначено алфавіт мови, на основі якої ви створюєте нову мову. Натисніть кнопку , щоб відредагувати алфавіт.
    4. Словник, який буде використовуватися системою для розпізнавання та перевірки розпізнаного тексту. Можливі такі варіанти:
      • Ні

Не підключати словник до мови.

  • Вбудований словник

Використовується словник, що поставляється з програмою.

  • Словник користувача

Щоб наповнити словник або підключити старий словник користувача або текстовий файл у ANSI-кодуванні (слова повинні бути розділені пробілами або іншими символами, не включеними до алфавіту), натисніть кнопку Властивості…

Примітка. Під час перевірки орфографії словникові слова мови користувача не виділяються, якщо в тексті вони зустрілися в тому вигляді, в якому вони задані в словнику, або в стандартному вигляді: всіма маленькими, всіма великими літерами, з великої літери.

Вигляд слова у словнику Допустимі варіанти написання слова в тексті
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
  • Регулярний вираз

Ви можете створити словник мови користувача, використовуючи регулярні вирази.

Докладніше див. у статті «Регулярні вирази».

  1. Ви можете вказати додаткові властивості мови. Для цього натисніть кнопку Додатково…

У діалозі Додаткові властивості мови ви можете вказати:

  • Символи, які можуть зустрічатися на початку або в кінці слова
  • Нелітерні символи, які пишуться окремо від слів
  • Вказати ігноровані символи, які можуть зустрічатися всередині слова
  • Символи, які напевне не можуть зустрічатися в текстах, які розпізнаються з підключенням цієї мови (заборонені символи)
  • Опцію Текст може містити арабські та римські цифри і абревіатури
  1. Після того, як мову створено, виберіть її для розпізнавання.

Докладніше про вибір мови див. у статті «Мови документа».

Стандартно мову користувача буде збережено в папку документа FineReader. Ви також можете зберегти всі мови та еталони в один файл у групі Еталони і мови користувача на закладці Розпізнати діалогу Налаштування (меню Сервіс>Налаштування…).

Як створити нову групу мов

Якщо під час розпізнавання текстів ви часто використовуєте деяке сполучення мов, для зручності можна об’єднати ці мови в групу.

  1. У меню Сервіс виберіть пункт Редактор мов….
  2. У діалозі Редактор мов, що відкрився, натисніть кнопку Новий….
  3. У діалозі Нова мова або група мов, що відкрився, виберіть пункт Створити нову групу мов і натисніть ОК.
  4. Відкриється діалог Властивості групи мов.

У цьому діалозі задайте ім’я групи і виберіть підключені мови.

Примітка. Ви можете вказати символи, які напевне не зустрічаються в розпізнаваному документі. Вказання таких символів може суттєво збільшити швидкість і надійність розпізнавання. Для цього у діалозі Властивості групи мов натисніть кнопку Додатково… і в діалозі Додаткові властивості групи мов введіть відповідні символи в поле Вилучені з розпізнавання символи.

  1. Натисніть кнопку ОК.

Створена група з’явиться у спадному списку Мови документа на головній панелі інструментів.

Стандартно групу мов користувача буде збережено в папку документа FineReader. Ви також можете зберегти всі мови та еталони в один файл у групі Еталони і мови користувача на закладці Розпізнати діалогу Налаштування (меню Сервіс>Налаштування…).

Порада. Комбінацію мов ви можете вказати безпосередньо у спадному списку мов вікна Сторінки.

  1. У спадному списку Мови документа виберіть пункт Інші мови….
  2. У діалозі Редактор мов, що відкрився, позначте пункт Вказати мови розпізнавання вручну.
  3. Виберіть потрібні мови й натисніть кнопку Скасувати.

1/14/2020 5:26:22 PM


Please leave your feedback about this article