Особливості роботи з мовами зі складним письмом

За допомогою ABBYY FineReader ви можете розпізнавати документи мовою іврит, їдиш, японською, китайською, тайською, корейською чи арабською мовою. Під час роботи з документами ієрогліфічною мовою, а також з документами однією з ієрогліфічних мов у поєднанні з європейською мовою існують деякі особливості.

Інсталяція системної підтримки мов

Для розпізнавання документів арабською, японською, китайською, тайською, корейською мовою, мовою іврит або їдиш може знадобитися інсталяція системної підтримки для цих мов.

В операційних системах Windows 8, Microsoft Windows Vista, Windows 7 підтримка цих мов включена стандартно.

Як інсталювати системну підтримку вказаних мов на операційній системі Microsoft Windows XP:

  1. Натисніть кнопку Пуск на Панелі завдань.
  2. Виберіть Панель керування>Мова і регіональні стандарти.
  3. На закладці Мови відмітьте пункт:
    • Інсталювати підтримку мов з письмом справа наліво і складним письмом

для підтримки івриту, їдишу, арабської і тайської мов

  • Інсталювати підтримку мов з письмом ієрогліфами

для підтримки японської, китайської і корейської мов

  1. Натисніть OK.

Рекомендовані для роботи шрифти

Для розпізнавання документів арабською, японською, китайською, тайською, корейською мовою, мовою іврит або їдиш може знадобитися інсталяція додаткових шрифтів Windows. Подана нижче таблиця містить рекомендовані для роботи шрифти:

Мови розпізнавання Рекомендований шрифт
Арабська Arial™ Unicode™ MS*
Іврит Arial™ Unicode™ MS*
Їдиш Arial™ Unicode™ MS*
Тайська

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Китайська спрощена,

китайська традиційна,

корейська, корейська (хангиль),

японська

Arial™ Unicode™ MS*

шрифти родини SimSun

Наприклад: SimSun (Founder Extended),

SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(for-ISO10646)

STSong

* Шрифт, який інсталюється разом з операційною системою Microsoft Windows XP і пакетами програм Microsoft Office 2000 або пізнішої версії.

Нижче містяться поради і рекомендації, дотримуючись яких, ви отримаєте розпізнаний документ вищої якості.

Як відключити автоматичну обробку зображень

Стандартно розпізнавання сторінок, доданих у документ FineReader, виконується в автоматичному режимі.

Однак якщо ваш документ містить текст ієрогліфічною мовою у поєднанні з якоюсь європейською мовою, то рекомендується відключити опцію автоматичного визначення орієнтації сторінок, а опцію розбивання здвоєних сторінок використовувати, тільки якщо всі зображення сторінок мають правильну орієнтацію (наприклад, не відскановані у переверненому вигляді).

Опції Визначати орієнтацію сторінок і Ділити розворот книги можна вмикати і вимикати в діалозі Налаштування на закладці Сканувати/Відкрити.

Примітка. Якщо документ написано арабською мовою, івритом або мовою їдиш і потрібно виконати розбивання здвоєних сторінок, то для коректного відновлення порядку сторінок документа спочатку виберіть мову розпізнавання і тільки після цього скористайтеся опцією Ділити розворот книги. Ви також можете відновити початкову нумерацію документа після розбивання сторінок, використовуючи опцію Поміняти місцями сторінки розвороту книги. Докладніше див. «Документ FineReader».

Якщо документ має складну структуру, то рекомендується відключити автоматичний аналіз і розпізнавання зображення і виконати ці операції вручну.

Як відключити автоматичний аналіз і розпізнавання зображення:

  1. Відкрийте діалог Налаштування (меню Сервіс>Налаштування…).
  2. На закладці Сканувати/Відкрити зніміть виділення з опції Автоматично обробляти додані сторінки.
  3. Натисніть кнопку ОК.

Інструкції з розпізнавання документів кількома мовами

Розглянемо на прикладі процес розпізнавання документа, який містить текст англійською та китайською мовами.

  1. На головній панелі інструментів у переліку Мови розпізнавання виберіть пункт Інші мови…. У діалозі Редактор мов, що відкрився, позначте пункт Вказати мови розпізнавання вручну і виберіть зі списку мов китайську та англійську.
  2. Відскануйте або відкрийте зображення.
  3. Якщо деякі зони було виділено неправильно:
    • Виділіть зони на зображеннях вручну, використовуючи інструменти для редагування форми і положення зон.
    • Якщо на зображенні є зони, в яких немає змішаного тексту, виділіть їх. Потім на панелі Параметри зони виберіть потрібну мову (китайську або англійську).

Увага! Вказати мову можна тільки для зон одного типу. Якщо ви одночасно вибрали зони Текст і Таблиця, вказати мову не можна.

  1. Натисніть кнопку Розпізнати.

Якщо у вікні Текст не відображаються ієрогліфи

Якщо у вікні Текст ієрогліфи відображаються некоректно, можливо, ви вибрали режим оформлення Простий текст.

Як змінити шрифт, який використовується для відображення тексту в режимі Простий текст:

  1. Відкрийте діалог Налаштування (меню Сервіс>Налаштування…).
  2. Перейдіть на закладку Вигляд.
  3. У спадному списку Шрифт, що використовується в режимі Простий текст виберіть шрифт Arial Unicode MS.
  4. Натисніть кнопку OK.

Якщо у вікні Текст не відбулося жодних змін, то для вирішення цієї проблеми зверніться до статті «Якщо у розпізнаному тексті некоректно відображається шрифт».

Як змінити напрямок письма у розпізнаному тексті

У процесі розпізнавання програма ABBYY FineReader автоматично визначає напрямок письма у тексті. Якщо необхідно, ви можете скорегувати його вручну.

  1. Перейдіть у вікно Текст.
  2. Виділіть один або кілька абзаців.
  3. На панелі інструментів вікна Текст натисніть кнопку .

Примітка. Для ієрогліфічного тексту передбачено спеціальну опцію Напрямок ієрогліфічного тексту, що дозволяє вибрати напрямок письма до розпізнавання. Докладніше див. «Як відредагувати властивості тексту».

14.01.2020 17:26:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.