Ако програмата не може да разпознае някои от символите

ABBYY FineReader 14 използва данни за езика на документа при разпознаване на текст. Програмата може да не успее да разпознае някои символи в документа с непознати елементи (напр. номера на кодове), защото езикът на документа може да не съдържа тези символи. За да разпознаете такива документи, можете да създадете персонализиран език, който има всички необходими символи. Можете също да създадете групи от няколко OCR проекта и да ги използвате при разпознаване на документи.

Как да създадете потребителски език

  1. Отворете диалоговия прозорец Опции (щракнете върху Инструменти > Опции..., за да отворите този диалогов прозорец), щракнете върху раздела Езици.
  2. Щракнете върху бутона Нов....
  3. В отворилия се диалогов прозорец изберете опцията Създаване на нов език на базата на съществуващ, изберете езика, който искате да изплозвате като база за новия език, и щракнете върху OK.
  4. Ще се отвори диалоговият прозорец Свойства на езиците. В този диалогов прозорец:
    1. Въведете име за новия език.
    2. Избраният от Вас език в диалоговия прозорец Нов език или група се показва в Базов език падащия списък. От този падащ списък можете да изберете различен език.
    3. Азбука съдържа азбуката на базовия език. Ако искате да редактирате азбуката, щракнете върху бутона .
    4. Групата опции Речник съдържа няколко опции за речника, които ще се използват от програмата при разпознаване на текст и проверка на резултата:
      • Няма
        Езикът няма да има речник.
      • Вграден речник
        Ще се използва вграденият в програмата речник.
      • Потребителски речник
        Щракнете върху бутона Редактиране..., за да зададете термините в речника или да импортирате съществуващ персонализиран речник или текстов файл с кодиране Windows-1252 (термините трябва да са разделени от интервали или други символи, които не са от азбуката).
        Думите от потребителския речник няма да са маркирани като грешни, когато се проверява правописът в разпознатия текст. Те може да са написани с малки букви или изцяло с главни букви, или може да започват с главна буква.
Думи в речника Думи, които няма да се приемат за грешно изписани при проверка на правописа
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Регулярен израз дава възможност да създадете потребителски речник, като използвате регулярни изрази.
    Вижте също: Регулярни изрази.
  1. Езиците могат да имат няколко допълнителни свойства. За да промените тези свойства, щракнете върху бутона Разширени..., за да отворите диалоговия прозорец, Разширени свойства на език, където можете да задавате:
    • символи, които могат да са в началото или края на дума
    • небуквени символи, които се появяват отделно от думите
    • символи, които може да се показват в думите, но трябва да се игнорират
    • символи, които не могат да се появяват в текстове, разпознати с използването на този език (забранени символи)
    • опцията Tекстът може да съдържа арабски числа, римски числа или съкращения
  2. Вече можете да избирате новосъздадения език, когато избирате езици за разпознаване.
    За да научите повече за езиците за разпознаване, вижте ***Езици за OCR.

По подразбиране потребителският език се записва в папката на OCR проекта. Можете също да запишете всички потребителски модели и езици в един файл. За целтаотворете диалоговия прозорец Опции (щракнете върху Инструменти > Опции..., за да отворите този диалогов прозорец), щракнете върху раздела OCR, след което върху бутона Записване на шаблони и езици....

Създаване на езикова група

Ако възнамерявате да използвате определена езикова комбинация редовно, добре е за удобство да групирате езиците заедно.

  1. Отворете диалоговия прозорец Опции (щракнете върху Инструменти > Опции..., за да отворите този диалогов прозорец), и щракнете върху раздела Езици.
  2. Щракнете върху бутона Нов....
  3. В диалоговия прозорец Нов език или група изберете опцията Създаване на нова група езици и щракнете върху OK.
  4. Ще се отвори диалоговият прозорец Свойства на езикова група. В този диалогов прозорец задайте име за езиковата група и изберете езиците, които искате да включите в нея.
    Ако знаете, че в текста няма да се включват определени символи, може да е по-удобно изрично да ги укажете в списъка със забранени символи. По този начин можете да увеличите скоростта и точността на разпознаване. За да зададете тези символи, щракнете върху бутона Разширени... в диалоговия прозорец Свойства на езикова група и въведете забранените символи в полето Забранени символи.
  5. Щракнете върху OK.

Новата група ще се покаже в падащия списък с езици в главната лента с инструменти main toolbar.

По подразбиране потребителските езикови се записват в папката на OCR проекта. Можете също да запишете всички потребителски модели и езици в един файл. За целтаотворете диалоговия прозорец Опции (щракнете върху Инструменти > Опции..., за да отворите този диалогов прозорец), щракнете върху раздела OCR, след което върху бутона Записване на шаблони и езици....

Съвет. Можете да използвате падащия списък с езици в главната лента с инструменти, за да изберете езикова група.

  1. Изберете Още езици... от падащия списък с езици в главната лента с инструменти.
  2. В диалоговия прозорец Редактор Езици изберете опцията Посочете ръчно езиците за OCR.
  3. Изберете желаните езици и щракнете върху OK.

02.11.2018 16:19:10


Please leave your feedback about this article