Нерозпізнані символи

У процесі роботи програма базується на знанні про мову, яка вказана як мова розпізнавання. Якщо в документі багато незвичайних конструкцій, наприклад артикулів, може виявитися, що мова розпізнавання не містить частини символів, що використовуються в тексті. У такому разі виникають помилки. Перед розпізнаванням такого документа необхідно створити нову мову, яка буде містити всі символи, що використовуються в тексті. Ви також можете об’єднати наявні мови в нову групу та під час розпізнавання підключити саме їх.

Як створити нову мову

  1. Відкрийте закладку Мови у діалозі Налаштування (меню Інструменти > Налаштування...).
  2. Натисніть кнопку Нова...
  3. У діалозі, що відкрився, встановіть перемикач у положення Створити нову мову на підставі наявної, виберіть мову, на основі якої ви створите нову, та натисніть кнопку ОК.
  4. Відкриється діалог Властивості мови. У цьому діалозі визначіть усі необхідні параметри:
    1. Ім’я нової мови.
    2. У полі Базова мова вказано мову, на основі якої ви створите нову мову. У цьому полі відображається мова, яку ви вибрали в діалозі Нова мова або група мов. У випадному списку ви можете вибрати іншу мову.
    3. У полі Абетка мови вказано алфавіт мови, на основі якого ви створите нову мову. Натисніть кнопку , щоб редагувати алфавіт.
    4. Словник, який буде використовуватися системою під час розпізнавання та перевірки розпізнаного тексту. Можливі такі варіанти:
      • Немає
        Не підключати словник до мови.
      • Вбудований словник
        Використовується словник, що доставляється з програмою.
      • Словник користувача
        Щоб наповнити словник або підключити старий словник користувача або текстовий файл в ANSI-кодуванні (слова повинні бути розділені пробілами або іншими символами, не включеними до алфавіту), натисніть кнопку Властивості....
        Під час перевірки орфографії словникові слова мови користувача не виділяються, якщо в тексті вони зустрілися в тому вигляді, у якому вони задані в словнику, або в стандартному вигляді: всіма маленькими, всіма великими літерами, з великої літери.
Вигляд слова у словнику Допустимі варіанти написання слова в тексті
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
abc aBc, abc, Abc, ABC
  • Регулярний вираз
    Ви можете створити словник мови користувача, використовуючи регулярні вирази.
    Див. також «Регулярні вирази».
  1. Ви можете вказати додаткові властивості мови. Для цього натисніть кнопку Додатково...
    У діалозі Додаткові властивості мови ви можете вказати:
    • Символи, які можуть зустрічатися на початку або в кінці слова
    • Нелітерні символи, які пишуться окремо від слів
    • Вказати ігноровані символи, які можуть траплятися всередині слова
    • Символи, які напевне не можуть траплятися в текстах, що розпізнаються з підключенням цієї мови (заборонені символи)
    • Опцію Текст може містити арабські та римські цифри і абревіатури.
  2. Після того як мову створено, виберіть її для розпізнавання.
    Докладніше про вибір мови див. у статті «Мови розпізнавання».

За замовчуванням мова користувача буде збережена в папку OCR-проекту. Ви також можете зберегти всі мови користувача й еталони в один файл у групі Еталони та мови користувача на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).

Як створити нову групу мов

Якщо під час розпізнавання текстів ви часто використовуєте певне поєднання мов, для зручності можна об’єднати ці мови в групу.

  1. Відкрийте закладку Мови у діалозі Налаштування (меню Інструменти > Налаштування...).
  2. Натисніть кнопку Нова...
  3. У діалозі, що відкрився, Нова мова або група мов виберіть пункт Створити нову групу мов і натисніть ОК.
  4. Відкриється діалог Властивості групи мов.
    У цьому діалозі задайте ім’я групи та виберіть підключені мови.
    Ви можете вказати символи, які напевне не зустрічаються в розпізнаваному документі. Вказання таких символів може суттєво збільшити швидкість і надійність розпізнавання. Для цього в діалозі Властивості групи мов натисніть кнопку Додатково... та в діалозі Додаткові властивості групи мов введіть відповідні символи в поле Вилучені з розпізнавання символи.
  5. Натисніть кнопку ОК.

Створена група з’явиться у випадному списку мов на головній панелі інструментів.

За замовчуванням група мов користувача буде збережена в папку OCR-проекту. Ви також можете зберегти всі мови користувача й еталони в один файл у групі Еталони та мови користувача на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).

Порада. Комбінацію мов ви можете вказати безпосередньо у випадному списку мов вікна OCR-редактора.

  1. У випадному списку мов на головній панелі інструментів виберіть пункт Повний список мов...
  2. У діалозі, що відкрився, Редактор мов позначте пункт Вкажіть OCR-мови вручну.
  3. Виберіть необхідні мови та натисніть кнопку ОК.

02.11.2018 16:20:06

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.