Работа с езици с набор от сложни символи

С ABBYY FineReader можете да разпознавате документи на арабски, иврит, идиш, японски, китайски, тайландски и корейски езици. Някои допълнителни съображения трябва да се имат предвид при работа с документи на китайски, японски или корейски и документи, в които се използва комбинация от CJK и европейски езици.

Инсталиране на езикова поддръжка

За да можете да разпознавате текстове, написани на арабски, иврит, идиш, тайландски, китайски, японски и корейски, може да е необходимо да инсталирате тези езици.

Microsoft Windows 8, Windows 7 и Windows Vista поддържат тези езици по подразбиране.

За да инсталирате нови езици в Microsoft Windows XP:

  1. Щракнете върху Start (Старт) в лентата с инструменти.
  2. Изберете Control Panel > Regional and Language Options (Контролен панел > Регионални и езикови опции).
  3. Щракнете върху раздел Languages (Езици) и изберете следните опции:
    • Инсталиране на файлове за езици с набор от сложни символи и насоченост отдясно наляво (включително тайландски)

за поддръжка на арабски, иврит, идиш и тайландски.

  • Инсталиране на файлове за източно-азиатски езици

за поддръжка на японски, китайски и корейски

  1. Щракнете върху OK.

Препоръчителни шрифтове

Разпознаването на текстове на арабски, иврит, идиш, тайландски, китайски, японски и корейски може да изисква инсталиране на допълнителни шрифтове в Windows. Таблицата по-долу изброява препоръчителните шрифтове за текстове на тези езици.

Език на разпознаване Препоръчителен шрифт
Арабски Arial™ Unicode™ MS*
Иврит Arial™ Unicode™ MS*
Идиш Arial™ Unicode™ MS*
Тайландски

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Китайски (опростен),

китайски (традиционен),

японски, корейски,

корейски (хангул)

Arial™ Unicode™ MS*

Шрифтове SimSun

например: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(за-ISO10646)

STSong

* Този шрифт е инсталиран с Microsoft Windows XP и Microsoft Office 2000 или по-нова версия.

Разделите по-долу съдържат съвет за подобряване на точността на разпознаване.

Забраняване на автоматичната обработка

По подразбиране всички страници, които добавите в ABBYY FineReader документ, се разпознават автоматично.

Все пак, ако Вашият документ съдържа текст, представляващ комбинация от CJK език и европейски език, ние Ви препоръчваме да забраните автоматичното разпознаване на ориентацията на страницата и да използвате опцията за разделяне на двойни страници, само ако всички изображения на страници имат правилна ориентация (напр. не са сканирани завъртяни на 180°).

Опциите Откриване ориентация на страница и Раздели срещуположни страници могат да бъдат разрешени и забранени от раздел Сканиране/Отваряне в диалоговия прозорец Опции.

Забележка: За да разделите срещуположни страници на арабски, иврит или идиш, първо се уверете, че сте избрали съответния език за разпознаване и след това изберете опцията Раздели срещуположни страници. Така страниците ще бъдат подредени правилно. Можете също да възстановите оригиналната номерация на страниците, като изберете опцията Размяна на страници на книга. За подробности вижте "Какво е FineReader документ?"

Ако Вашият документ има комплексна структура, препоръчваме Ви да забраните автоматичния анализ и разпознаване на изображения и да изпълните тези операции ръчно.

За да забраните автоматичен анализ и разпознаване:

  1. Отворете диалоговия прозорец Опции (Инструменти> Опции…).
  2. Махнете отметката от опцията Автоматично обработвай страниците при добавяне в раздел Сканиране/Отваряне.
  3. Щракнете върху OK.

Разпознаване на документи, написани на повече от един език

В инструкциите по-долу е показан като пример документ, който съдържа текст на английски и на китайски език.

  1. От главната лента с инструменти изберете Още езици… от падащия списък Езици на документа. Изберете Определете езиците ръчно от диалоговия прозорец Редактор Езици и изберете китайски и английски от списъка с езици.
  2. Сканирайте или отворете изображенията.
  3. Ако програмата не може да определи всички области в изображението:
    • Задайте ръчно областите с инструментите за редактиране на области.
    • Задайте всички области, които съдържат само един език. За да направите това, изберете ги и задайте езика им в панел Свойства на областта.

Важно!Езикът може да бъде зададен само за области от един и същ тип. Ако изберете области от различен тип, например текст и таблица, няма да можете да определите език.

  1. Щракнете върху бутон Прочети в главната лента с инструменти.

Ако не-европейски символи не се извеждат в прозореца Текст

Ако текст на CJK език е показан неправилно в прозорец Текст, можете да изберете режим Печат на текст.

За да промените използвания шрифт в режим Печат на текст:

  1. Отворете диалоговия прозорец Опции (Инструменти > Опции…).
  2. Щракнете върху раздел Изглед.
  3. Изберете Arial Unicode MS от падащия списък Използвани шрифтове за показване на обикновен текст.
  4. Щракнете върху OK.

Ако това не помогне и текстът в прозорец Текст все още се показва неправилно, вижте "Ако някои символи са заменени с "?" или "□" в прозореца Текст."

Смяна на посоката на разпознат текст

ABBYY FineReader определя автоматично посоката на текста, но можете да зададете ръчно посоката на текста.

  1. Изберете един или повече параграфи в прозореца Текст.
  2. Щракнете върху бутона в лентата с инструменти в прозореца Текст.

Забележка: Можете да използвате падащия списък Посока на CJK текст в прозореца Изображение, за да укажете посоката на текста преди разпознаване. Вижте Ако вертикален или негативен текст не е разпознат правилно за подробности.

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.