Характеристики на документа, които да се вземат предвид преди разпознаване

Качеството на изображенията има голямо влияние върху качеството на разпознаване. Този раздел показва какви фактори трябва да вземете предвид преди разпознаване на изображенията.

Езици за OCR

ABBYY FineReader разпознава едно- и многоезични документи (напр. написани на два или повече езика). За многоезичните документи трябва да изберете няколко езика за разпознаване.

За да изберете езици за разпознаване, щракнете върху Опции >  Езици и изберете една от следните опции:

  • Изберете автоматично езиците за OCR от следния списък
    ABBYY FineReader автоматично ще избере подходящите езици от дефиниран от потребителя списък с езици. За да редактирате списъка с езици:
    1. Уверете се, че е избрана опцията Изберете автоматично езиците за OCR от следния списък.
    2. Щракнете върху Задайте....
    3. В Езици изберете желаните настройки и щракнете върху OK.
    4. В Опции, щракнете върху OK.
  • Посочете ръчно езиците за OCR
    Изберете тази опция, ако езикът, който Ви трябва, не е в списъка.

В диалоговия прозорец по-долу задайте един или повече езици. Ако често използвате конкретна езикова комбинация, можете да създадете нова група за тези езици.

Ако езикът не е в списъка, то:

  1. Той не се поддържа от ABBYY FineReader, или
    Пълният списък с поддържани езици вижте в Поддържани езици за OCR.
  2. Не се поддържа от Вашата версия на продукта.
    Пълният списък с езици, налични за Вашата версия на продукта, можете да намерите в диалоговия прозорец Лицензи (щракнете върху Помощ > За > Информация за лиценз, за да отворите този диалогов прозорец).

В допълнение към използването на вградени езици и групи езици, можете да създадете свои собствени езици и групи. Вижте също: Ако програмата не може да разпознае някои от символите.

Тип печат

Документите може да са отпечатани на различни устройства, например пишеща машина или факс апарат. Качеството на разпознаване е различно в зависимост от начина на отпечатване на документа. Можете да подобрите качеството на разпознаване, като изберете правилния тип печат в диалоговия прозорец Опции.

За повечето документи програмата ще определи типа на печат автоматично. За автоматично определяне на типа печат трябва да изберете опцията Авто в групата опции Тип документ в диалоговия прозорец Опции (щракнете върху Инструменти > Опции... > OCR за достъп до тези опции). Можете да обработите документа в пълноцветен или черно-бял режим.

Можете също да изберете ръчно типа печат, ако е необходимо.

Пример за машинописен текст. Всички букви са с еднаква широчина (сравнете например w и t). За текстове от този тип изберете Машинописен.
Пример за текст от факс апарат. Както виждате от примера, буквите не са ясни на някои места. Има също изкривявания и зацапване. За текстове от този тип изберете Факс.

След разпознаване на машинописен текст или такъв от факс, изберете Авто преди обработката на обикновени печатни документи.

Качество на печат

Документи с лошо качество с наличие на „шум“ (т.е. произволни черни точки или петънца), замъглени или неравни букви или изкривени редове и изместени очертания на таблици, може да изискват специфични настройки на сканиране.

Факс Вестник

Документите с лошо качество най-добре се сканират в скала на сивото. Когато сканирате в скала на сивото, програмата ще избере автоматично оптималната настройка за яркост автоматично.

Режимът на сканиране в скала на сивото запазва повече информация за буквите в сканирания текст, за да се постигнат по-добри резултати при разпознаване на документи със средно до лошо качество. Можете също да коригирате някои от дефектите ръчно, като използвате инструментите за редактиране на изображения, налични в Редактора на изображения. Вижте също: Ако изображението на документа Ви има дефекти и точността на разпознаване е ниска.

Режим на цветовете

Ако не трябва да запазвате оригиналните цветове, използвани в пълноцветен документ, можете да обработите документа в черно-бял режим. Това значително ще намали размера на получения OCR проект и ще ускори процеса на разпознаване. Обаче обработката на нискоконтрастни изображения в черно-бял режим може да доведе до лошо качество на разпознаването. Освен това не препоръчваме обработката в черно-бяло на фотографии, страници на списания и текстове на китайски, японски и корейски.

Съвет. Можете също да ускорите разпознаването на цветни и черно-бели документи, като изберете Бързо разпознаване в OCR в диалоговия прозорец Опции. За повече информация относно режимите на разпознаване вижте Опции за разпознаване.

За някои допълнителни препоръки при избор на правилния цветови режим вижте Съвети при сканиране.

След като документът е конвертиран в черно-бял, не можете да възстановите цветовете. За да получите цветен документ, отворете файл с цветни изображения или сканирайте хартиен документ в цветови режим.

17.05.2023 7:34:30

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.