Vlastnosti dokumentu posudzované pred OCR

Kvalita snímok má významný vplyv na kvalitu rozpoznávania. Táto časť vysvetľuje, na aké faktory treba prihliadať pred rozpoznávaním snímok:

Jazyky dokumentu

Program ABBYY FineReader umožňuje rozpoznávanie dokumentov ako v jednom, tak aj vo viacerých jazykoch (napr. písaných v dvoch alebo vo viacerých jazykoch). Pre viacjazyčné dokumenty musíte vybrať viac rozpoznávacích jazykov.

Ak chcete určiť jazyk rozpoznávania OCR vášho dokumentu, v rozbaľovacom zozname Jazyk dokumentu v hlavnom paneli nástrojov alebo v okne Úloha vyberte jednu z nasledujúcich možností:

  • Automatický výber

Program ABBYY FineReader automaticky vyberie správne jazyky z používateľom špecifikovaného zoznamu jazykov. Úprava zoznamu:

  1. Vyberte Ďalšie jazyky…
  2. V dialógovom okne Editor jazykov vyberte Automaticky vybrať jazyky dokumentov z nasledujúceho zoznamu.
  3. Kliknite na Určiť….
  4. V dialógovom okne Jazyky vyberte požadované jazyky.
  • Jazyk alebo kombinácia jazykov

Vyberte jazyk alebo kombináciu jazykov. Zoznam jazykov obsahuje nedávno použité jazyky rozpoznávania a angličtinu, nemčinu a francúzštinu.

  • Ďalšie jazyky…

Túto možnosť vyberte ak sa v zozname nezobrazuje jazyk, ktorý potrebujete.

V dialógovom okne Editor jazykov vyberte možnosť Určiť jazyky ručne a potom vyberte požadovaný jazyk alebo jazyky tak, že začiarknete príslušné začiarkávacie políčka. Ak často používate určitú kombináciu jazykov, môžete pre tieto jazyky vytvoriť novú skupinu.

Ak jazyk nie je na zozname, je to buď:

  1. Program ABBYY FineReader tento jazyk nepodporuje.

Úplný zoznam podporovaných jazykov nájdete v časti "Podporované jazyky."

  1. Vaša kópia programu ABBYY FineReader tento jazyk nepodporuje.

Úplný zoznam jazykov dostupných vo vašej kópii nájdete v dialógovom okne Licencie (Pomocník > O programe… > Informácie o licencii).

Okrem používania vstavaných jazykov a skupín jazykov si môžete vytvoriť aj vlastné. Podrobné informácie nájdete v časti "Ak program nedokáže rozpoznať niektoré znaky."

Druh tlače

Dokumenty môžu byť vytlačené na rôznych zariadeniach, ako sú písacie stroje a faxy. Kvalitu rozpoznávania OCR zlepšíte výberom správneho Typ dokumentu v dialógovom okne Možnosti.

Pri väčšine dokumentov program automaticky zistí druh tlače. Na automatické zistenie druhu tlače dokumentu musíte vybrať možnosť Automaticky pod Typ dokumentu v dialógovom okne Možnosti (Nástroje > Možnosti…). Dokument môžete spracovať v plnofarebnom alebo čiernobielom režime.

Ak to bude potrebné, druh tlače môžete nastaviť aj ručne.

Príklad textu písaného na písacom stroji. Všetky písmená majú rovnakú šírku (porovnajte napríklad "w" a "t"). V prípade takéhoto druhu textu vyberiete možnosť Písací stroj.
Príklad textu z faxového prístroja. Ako vidno z príkladu, písmená a znaky nie sú v niektorých častiach jasné, takisto sa tu vyskytuje šum a deformácia. V prípade takéhoto druhu textu vyberte možnosť Fax.

Tip: Ak chcete po rozpoznaní textu písaného na písacom stroji alebo faxu pokračovať v spracúvaní štandardne vytlačených dokumentov, nezabudnite nastaviť možnosť Automaticky.

Kvalita tlače

Dokumenty s nízkou kvalitou tlače obsahujú "šum" (t. j. náhodné čierne body alebo škvrny), rozostrené a zdeformované znaky, pokrivené riadky a posunuté okraje tabuľky si môžu vyžadovať špeciálne skenovacie nastavenia.

Fax Noviny

Dokumenty nízkej kvality je najlepšie skenovať v odtieňoch sivej farby. Pri skenovaní v odtieňoch sivej farby vyberie program automaticky optimálnu hodnotu jasu.

Režim skenovania v odtieňoch sivej zachová v naskenovanom texte viac informácií o písmenách, čím zabezpečí pri rozpoznávaní dokumentov strednej až nízkej kvality lepšie výsledky rozpoznávania OCR. Niektoré druhy poškodenia môžete opraviť aj ručne pomocou nástrojov na úpravu snímok dostupných v Editore snímok. Podrobné informácie nájdete v časti „Predspracovanie obrazu."

Farebný režim

Ak nepotrebujete vo výstupnom dokumente zachovať farby, môžete dokument spracovať v čiernobielom režime. Tým sa značne zníži veľkosť výsledného dokumentu programu ABBYY FineReader a rýchlosť procesu optického rozpoznávania OCR. Spracovanie snímok s nízkym kontrastom v čiernobielom režime však môže spôsobiť zlú kvalitu optického rozpoznávania OCR. Spracovanie v čiernobielom režime neodporúčame ani v prípade fotografií, stránok časopisov a textu v čínštine, japončine a kórejčine.

Poznámka: Rýchlosť rozpoznávania farebných a čiernobielych dokumentov môžete zvýšiť výberom možnosti Rýchle čítanie na karte Čítať v dialógovom okne Možnosti. Viac informácií o režimoch rozpoznávania nájdete v časti Možnosti rozpoznávania OCR.

Výber farebného režimu:

  • Použite rozbaľovací zoznam Farebný režim v dialógovom okne Úloha alebo
  • Vyberte jednu z možností pod Farebný režim na karte Dokument v dialógovom okne Možnosti (Nástroje >Možnosti…).

Dôležité upozornenie! Po prevedení dokumentu do čiernobieleho režimu už nebudete môcť obnoviť pôvodné farby. Ak by ste potrebovali farebný dokument, otvorte súbor s farebnými obrázkami alebo naskenujte papierový dokument vo farebnom režime.

14.01.2020 17:26:21


Please leave your feedback about this article