- English (English)
- Bulgarian (Български)
- Chinese Simplified (简体中文)
- Chinese Traditional (繁體中文)
- Czech (Čeština)
- Danish (Dansk)
- Dutch (Nederlands)
- French (Français)
- German (Deutsch)
- Greek (Ελληνικά)
- Hungarian (Magyar)
- Italian (Italiano)
- Japanese (日本語)
- Korean (한국어)
- Polish (Polski)
- Portuguese (Brazilian) (Português (Brasil))
- Slovak (Slovenský)
- Spanish (Español)
- Swedish (Svenska)
- Turkish (Türkçe)
- Vietnamese (Tiếng Việt)
Нерозпізнані символи
У процесі роботи програма базується на знанні про мову, яка вказана як мова розпізнавання. Якщо в документі багато незвичайних конструкцій, наприклад артикулів, може виявитися, що мова розпізнавання не містить частини символів, що використовуються в тексті. У такому разі виникають помилки. Перед розпізнаванням такого документа необхідно створити нову мову, яка буде містити всі символи, що використовуються в тексті. Ви також можете об’єднати наявні мови в нову групу та під час розпізнавання підключити саме їх.
- Відкрийте закладку Мови у діалозі Налаштування (меню Інструменти > Налаштування...).
- Натисніть кнопку Нова...
- У діалозі, що відкрився, встановіть перемикач у положення Створити нову мову на підставі наявної, виберіть мову, на основі якої ви створите нову, та натисніть кнопку ОК.
- Відкриється діалог Властивості мови. У цьому діалозі визначіть усі необхідні параметри:
- Ім’я нової мови.
- У полі Базова мова вказано мову, на основі якої ви створите нову мову. У цьому полі відображається мова, яку ви вибрали в діалозі Нова мова або група мов. У випадному списку ви можете вибрати іншу мову.
- У полі Абетка мови вказано алфавіт мови, на основі якого ви створите нову мову. Натисніть кнопку , щоб редагувати алфавіт.
- Словник, який буде використовуватися системою під час розпізнавання та перевірки розпізнаного тексту. Можливі такі варіанти:
- Немає
Не підключати словник до мови. - Вбудований словник
Використовується словник, що доставляється з програмою. - Словник користувача
Щоб наповнити словник або підключити старий словник користувача або текстовий файл в ANSI-кодуванні (слова повинні бути розділені пробілами або іншими символами, не включеними до алфавіту), натисніть кнопку Властивості....
Під час перевірки орфографії словникові слова мови користувача не виділяються, якщо в тексті вони зустрілися в тому вигляді, у якому вони задані в словнику, або в стандартному вигляді: всіма маленькими, всіма великими літерами, з великої літери.
Вигляд слова у словнику | Допустимі варіанти написання слова в тексті |
abc | abc, Abc, ABC |
Abc | abc, Abc, ABC |
ABC | abc, Abc, ABC |
abc | aBc, abc, Abc, ABC |
- Регулярний вираз
Ви можете створити словник мови користувача, використовуючи регулярні вирази.
Див. також «Регулярні вирази».
- Ви можете вказати додаткові властивості мови. Для цього натисніть кнопку Додатково...
У діалозі Додаткові властивості мови ви можете вказати: - Символи, які можуть зустрічатися на початку або в кінці слова
- Нелітерні символи, які пишуться окремо від слів
- Вказати ігноровані символи, які можуть траплятися всередині слова
- Символи, які напевне не можуть траплятися в текстах, що розпізнаються з підключенням цієї мови (заборонені символи)
- Опцію Текст може містити арабські та римські цифри і абревіатури.
- Після того як мову створено, виберіть її для розпізнавання.
Докладніше про вибір мови див. у статті «Мови розпізнавання».
За замовчуванням мова користувача буде збережена в папку OCR-проекту. Ви також можете зберегти всі мови користувача й еталони в один файл у групі Еталони та мови користувача на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).
Якщо під час розпізнавання текстів ви часто використовуєте певне поєднання мов, для зручності можна об’єднати ці мови в групу.
- Відкрийте закладку Мови у діалозі Налаштування (меню Інструменти > Налаштування...).
- Натисніть кнопку Нова...
- У діалозі, що відкрився, Нова мова або група мов виберіть пункт Створити нову групу мов і натисніть ОК.
- Відкриється діалог Властивості групи мов.
У цьому діалозі задайте ім’я групи та виберіть підключені мови.
Ви можете вказати символи, які напевне не зустрічаються в розпізнаваному документі. Вказання таких символів може суттєво збільшити швидкість і надійність розпізнавання. Для цього в діалозі Властивості групи мов натисніть кнопку Додатково... та в діалозі Додаткові властивості групи мов введіть відповідні символи в поле Вилучені з розпізнавання символи. - Натисніть кнопку ОК.
Створена група з’явиться у випадному списку мов на головній панелі інструментів.
За замовчуванням група мов користувача буде збережена в папку OCR-проекту. Ви також можете зберегти всі мови користувача й еталони в один файл у групі Еталони та мови користувача на закладці Розпізнавання діалогу Налаштування (меню Інструменти > Налаштування...).
Порада. Комбінацію мов ви можете вказати безпосередньо у випадному списку мов вікна OCR-редактора.
- У випадному списку мов на головній панелі інструментів виберіть пункт Повний список мов...
- У діалозі, що відкрився, Редактор мов позначте пункт Вкажіть мови розпізнавання вручну.
- Виберіть необхідні мови та натисніть кнопку ОК.
6/12/2024 2:31:57 PM