Нерозпізнані символи

У процесі роботи програма базується на знанні про мову, яка вказана як мова розпізнавання. Якщо в документі багато незвичайних конструкцій, наприклад артикулів, може виявитися, що мова розпізнавання не містить частини символів, що використовуються в тексті. У такому разі виникають помилки. Перед розпізнаванням такого документа необхідно створити нову мову, яка буде містити всі символи, що використовуються в тексті. Ви також можете об’єднати наявні мови в нову групу та під час розпізнавання підключити саме їх.

Як створити нову мову

  1. Відкрийте закладку Мови у діалозі Налаштування (меню Інструменти > Налаштування...).
  2. Натисніть кнопку Нова...
  3. У діалозі, що відкрився, встановіть перемикач у положення Створити нову мову на підставі наявної, виберіть мову, на основі якої ви створите нову, та натисніть кнопку ОК.
  4. Відкриється діалог Властивості мови. У цьому діалозі визначіть усі необхідні параметри:
    1. Ім’я нової мови.
    2. У полі Базова мова вказано мову, на основі якої ви створите нову мову. У цьому полі відображається мова, яку ви вибрали в діалозі Нова мова або група мов. У випадному списку ви можете вибрати іншу мову.
    3. У полі Абетка мови вказано алфавіт мови, на основі якого ви створите нову мову. Натисніть кнопку , щоб редагувати алфавіт.
    4. Словник, який буде використовуватися системою під час розпізнавання та перевірки розпізнаного тексту. Можливі такі варіанти:
      • Немає
        Не підключати словник до мови.
      • Вбудований словник
        Використовується словник, що доставляється з програмою.
      • Словник користувача
        Щоб наповнити словник або підключити старий словник користувача або текстовий файл в ANSI-кодуванні (слова повинні бути розділені пробілами або іншими символами, не включеними до алфавіту), натисніть кнопку Властивості....
        Під час перевірки орфографії словникові слова мови користувача не виділяються, якщо в тексті вони зустрілися в тому вигляді, у якому вони задані в словнику, або в стандартному вигляді: всіма маленькими, всіма великими літерами, з великої літери.
Вигляд слова у словнику Допустимі варіанти написання слова в тексті
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
abc aBc, abc, Abc, ABC
  • Регулярний вираз
    Ви можете створити словник мови користувача, використовуючи регулярні вирази.
    Див. також «Регулярні вирази».
  1. Ви можете вказати додаткові властивості мови. Для цього натисніть кнопку Додатково...
    У діалозі Додаткові властивості мови ви можете вказати:
    • Символи, які можуть зустрічатися на початку або в кінці слова
    • Нелітерні символи, які пишуться окремо від слів
    • Вказати ігноровані символи, які можуть траплятися всередині слова
    • Символи, які напевне не можуть траплятися в текстах, що розпізнаються з підключенням цієї мови (заборонені символи)
    • Опцію Текст може містити арабські та римські цифри і абревіатури.
  2. Після того як мову створено, виберіть її для розпізнавання.
    Докладніше про вибір мови див. у статті «Мови розпізнавання».

За замовчуванням мова користувача буде збережена в папку OCR-проекту. Ви також можете зберегти всі мови користувача й еталони в один файл у групі Еталони та мови користувача на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).

Як створити нову групу мов

Якщо під час розпізнавання текстів ви часто використовуєте певне поєднання мов, для зручності можна об’єднати ці мови в групу.

  1. Відкрийте закладку Мови у діалозі Налаштування (меню Інструменти > Налаштування...).
  2. Натисніть кнопку Нова...
  3. У діалозі, що відкрився, Нова мова або група мов виберіть пункт Створити нову групу мов і натисніть ОК.
  4. Відкриється діалог Властивості групи мов.
    У цьому діалозі задайте ім’я групи та виберіть підключені мови.
    Ви можете вказати символи, які напевне не зустрічаються в розпізнаваному документі. Вказання таких символів може суттєво збільшити швидкість і надійність розпізнавання. Для цього в діалозі Властивості групи мов натисніть кнопку Додатково... та в діалозі Додаткові властивості групи мов введіть відповідні символи в поле Вилучені з розпізнавання символи.
  5. Натисніть кнопку ОК.

Створена група з’явиться у випадному списку мов на головній панелі інструментів.

За замовчуванням група мов користувача буде збережена в папку OCR-проекту. Ви також можете зберегти всі мови користувача й еталони в один файл у групі Еталони та мови користувача на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).

Порада. Комбінацію мов ви можете вказати безпосередньо у випадному списку мов вікна OCR-редактора.

  1. У випадному списку мов на головній панелі інструментів виберіть пункт Повний список мов...
  2. У діалозі, що відкрився, Редактор мов позначте пункт Вкажіть OCR-мови вручну.
  3. Виберіть необхідні мови та натисніть кнопку ОК.

11/2/2018 4:20:06 PM


Please leave your feedback about this article