Vlastnosti dokumentu posudzované pred OCR

Kvalita snímok má významný vplyv na kvalitu OCR. Táto časť vysvetľuje, na aké faktory treba prihliadať pred rozpoznávaním snímok.

Jazyky OCR

Program ABBYY FineReader umožňuje rozpoznávanie dokumentov v jednom aj vo viacerých jazykoch (napr. písaných v dvoch alebo vo viacerých jazykoch). Pre viacjazyčné dokumenty musíte vybrať viac jazykov OCR.

Ak chcete vybrať jazyky OCR, kliknite na Možnosti > Jazyky a vyberte jednu z nasledujúcich možností:

  • Automaticky vybrať jazyky rozpoznávania OCR z nasledujúceho zoznamu
    Program ABBYY FineReader automaticky vyberie vhodné jazyky z používateľom definovaného zoznamu jazykov. Ak chcete upraviť zoznam jazykov:
    1. Skontrolujte, či je vybratá možnosť Automaticky vybrať jazyky rozpoznávania OCR z nasledujúceho zoznamu.
    2. Kliknite na tlačidlo Určiť....
    3. V dialógovom okne Jazyky vyberte požadované jazyky a kliknite na OK.
    4. V dialógovom okne Možnosti kliknite na OK.
  • Zadajte jazyky OCR manuálne
    Túto možnosť vyberte ak v zozname nie je jazyk, ktorý potrebujete.

V dialógovom okne nižšie zadajte jeden alebo viac jazykov. Ak často používate určitú kombináciu jazykov, môžete pre tieto jazyky vytvoriť novú skupinu.

Ak jazyk nie je na zozname, nie je:

  1. Podporovaný programom ABBYY FineReader, alebo
    Úplný zoznam podporovaných jazykov nájdete v časti Podporované jazyky OCR.
  2. Nie je podporovaný touto verziou produktu.
    Úplný zoznam jazykov dostupných vo vašej verzii produktu nájdete v dialógovom okne Licencie (toto dialógové okno otvorte kliknutím na Pomocník > O programe > Informácie o licencii).

Okrem používania vstavaných jazykov a skupín jazykov si môžete vytvoriť aj vlastné jazyky a skupiny. Pozrite tiež: Ak program nedokáže rozpoznať určité znaky.

Druh tlače

Dokumenty môžu byť vytlačené pomocou rôznych zariadení, ako napríklad písacie stroje a faxy. Kvalita rozpoznávania OCR môže byť rôzna podľa toho, ako bol dokument vytlačený. Kvalitu rozpoznávania OCR môžete zlepšiť výberom správneho druhu tlače v dialógovom okne Možnosti.

V prípade väčšiny dokumentov program zistí typ tlače automaticky. Pre automatické zisťovanie typu tlače musí byť vybratá možnosť Automaticky v skupine možností Typ dokumentu v dialógovom okne Možnosti (kliknite na Nástroje > Možnosti... > OCR, aby ste získali prístup k týmto možnostiam). Dokumenty môžete spracovávať v plnofarebnom alebo čiernobielom režime.

Podľa potreby môžete tiež zvoliť manuálny výber typu tlače.

Príklad textu napísaného na písacom stroji. Všetky písmená majú rovnakú šírku (porovnajte napríklad „w“ a „t“). V prípade takéhoto typu textu vyberte Písací stroj.
Príklad textu vytlačeného faxovým prístrojom. Na tomto príklade vidíte, že písmená nie sú na niektorých miestach zreteľné. Vyskytuje sa tu aj šum a deformácie. V prípade takéhoto typu textu vyberte Fax.

Po rozpoznaní textov napísaných na písacom stroji alebo vytlačených faxom vyberte Automaticky pred spracovaním bežných tlačených dokumentov.

Kvalita tlače

Dokumenty s nízkou kvalitou tlače obsahujúce „šum“ (t. j. náhodné čierne body alebo škvrny), rozostrené a zdeformované znaky, pokrivené riadky a posunuté okraje tabuľky si môžu vyžadovať špeciálne nastavenia skenovania.

Fax Noviny

Dokumenty nízkej kvality je najlepšie skenovať v odtieňoch sivej farby. Pri skenovaní v odtieňoch sivej farby program automaticky vyberie optimálnu hodnotu jasu.

Režim skenovania v odtieňoch sivej zachová v naskenovanom texte viac informácií o písmenách, čím zabezpečí pri rozpoznávaní dokumentov strednej až nízkej kvality lepšie výsledky rozpoznávania OCR. Niektoré druhy chýb môžete opraviť aj ručne pomocou nástrojov na úpravu snímok dostupných programe Image Editor. Pozrite tiež: Ak sú na snímke dokumentu chyby a presnosť OCR je nízka.

Farebný režim

Ak nepotrebujete vo výstupnom dokumente zachovať pôvodné farby, môžete dokument spracovať v čiernobielom režime. Tým sa značne zníži veľkosť výsledného projektu OCR a zrýchli sa proces OCR. Spracovanie snímok s nízkym kontrastom v čiernobielom režime však môže spôsobiť zlú kvalitu optického rozpoznávania OCR. Spracovanie v čiernobielom režime neodporúčame ani v prípade fotografií, strán časopisov a textu v čínštine, japončine a kórejčine.

Tip. Rozpoznávanie OCR farebných a čiernobielych dokumentov môžete tiež urýchliť vybratím Rýchle rozpoznávanie na karte OCR dialógového okna Možnosti. Viac informácií o režimoch rozpoznávania nájdete v časti Možnosti OCR.

Niektoré ďalšie odporúčania týkajúce sa výberu správneho farebného režimu nájdete v časti Tipy týkajúce sa skenovania.

Po prevedení dokumentu do čiernobieleho režimu už nebudete môcť obnoviť pôvodné farby. Ak chcete získať farebný dokument, otvorte súbor s farebnými snímkami alebo naskenujte papierový dokument vo farebnom režime.

02.11.2018 16:19:56


Please leave your feedback about this article