Vlastnosti dokumentů, které je nutno vzít v úvahu před rozpoznáváním OCR

Kvalita obrazů má významný dopad na kvalitu rozpoznávání. V této části se popisuje, se kterými faktory je nutno počítat před rozpoznáváním obrazů:

Jazyky dokumentu

Aplikace ABBYY FineReader rozpoznává jednojazyčné i vícejazyčné dokumenty. V případě vícejazyčných dokumentů je třeba zadat několik rozpoznávaných jazyků.

Při zadávání jazyka rozpoznávání OCR pro dokument vyberte jednu z následujících možností z rozevíracího seznamu Jazyk dokumentu na hlavním panelu nástrojů nebo v okně Úloha:

  • Automatický výběr

Aplikace ABBYY FineReader z uživatelsky definovaného seznamu jazyků automaticky vybere vhodné jazyky. Chcete-li tento seznam upravit:

  1. Zvolte položku Více jazyků…
  2. V dialogovém okně Jazykový editor zvolte možnost Automaticky vybrat jazyky dokumentu z následujícího seznamu.
  3. Klikněte na tlačítko Zadat….
  4. V dialogovém okně Jazyky vyberte požadované jazyky.
  • Jazyk nebo kombinace jazyků

Vyberte jazyk nebo jazykovou kombinaci. Seznam jazyků obsahuje poslední použité jazyky, ale i angličtinu, němčinu a francouzštinu.

  • Více jazyků…

Pokud požadovaný jazyk není v seznamu, vyberte tuto možnost.

V dialogovém okně Jazykový editor zvolte možnost Zadat jazyky ručně a požadovaný jazyk nebo jazyky poté zvolte zaškrtnutím příslušných políček. Používáte-li často určitou kombinaci jazyků, můžete pro tyto jazyky vytvořit novou skupinu.

Pokud požadovaný jazyk není v seznamu, jedná se o některou z následujících záležitostí:

  1. Jazyk není aplikací ABBYY FineReader podporován.

Kompletní seznam jazyků rozpoznávání najdete v části "Podporované jazyky."

  1. Vaše kopie aplikace tento jazyk nepodporuje.

Úplný seznam jazyků dostupných v této kopii naleznete v dialogovém okně Licence(Nápověda > O aplikaci… > Informace o licenci).

Kromě použití vestavěných jazyků a jazykových skupin můžete vytvořit i vlastní. Podrobnosti viz "Pokud program nedokáže rozpoznat některé znaky."

Druh tisku

Dokumenty lze tisknout na různých zařízeních, např. psacích strojích a faxech. Kvalitu rozpoznávání OCR lze zlepšit volbou správného Typ dokumentu v dialogovém okně Možnosti.

U většiny dokumentů program zjistí typ tisku automaticky. Pro automatické zjišťování typu tisku musí být zvolena možnost Automaticky pod názvem Typ dokumentu v dialogovém okně Možnosti (Nástroje> Možnosti…). Dokument lze zpracovat v plnobarevném nebo černobílém režimu.

V případě potřeby se také můžete rozhodnout zvolit typ tisku ručně.

Ukázka textu psacího stroje. Všechna písmena mají stejnou šířku (porovnejte například "w" a "t"). Pro tento druh textu zvolte položku Psací stroj.
Příklad textu vytištěného faxem. Jak je vidět na tomto příkladu, písmena nejsou na některých místech jasná, a kromě nich je vidět šumy a zkreslení. Pro tento druh textu zvolte položku Fax.

Tip: Po rozpoznávání textů napsaných na stroji nebo faxů nezapomeňte před zpracováním běžně vytištěných dokumentů zvolit možnost Automaticky.

Kvalita tisku

Dokumenty s nízkou kvalitou tisku neboli s "šumem" (tj. náhodné černé tečky nebo skvrnky) nebo s rozmazanými a nestejnoměrnými písmeny, s šikmými řádky a posunutými okraji tabulek mohou vyžadovat specifické nastavení.

Fax Noviny

Dokumenty nízké kvality je nejvhodnější skenovat ve stupních šedé. Při skenování ve stupních šedé program automaticky vybere optimální hodnotu jasu.

Režim skenování ve stupních šedé zachová ve skenovaném textu více informací o písmenech pro dosažení lepších výsledků OCR při rozpoznávání dokumentů střední nebo nízké kvality. Některé defekty tisku můžete také opravit s použitím nástrojů pro úpravu obrázků, dostupných v Editoru obrázků. Podrobnosti naleznete v části Předběžné zpracování obrazů."

Barevný režim

Pokud nepotřebujete zachovat původní barvy v plnobarevném dokumentu, můžete dokument zpracovat v černobílém režimu. Značně se tím zmenší velikost výsledného dokumentu ABBYY FineReader a urychlí se proces rozpoznávání OCR. Zpracování obrazů s nízkým kontrastem v černobílém režimu však může  vést k nízké  kvalitě rozpoznávání OCR. Černobílé zpracování také nedoporučujeme pro fotografie, stránky z časopisů a texty v čínštině, japonštině a korejštině.

Poznámka: Rozpoznávání barevných a černobílých dokumentů můžete urychlit i volbou možnosti Rychlé čtení v kartě Číst v dialogovém okně Možnosti. Další informace o režimech rozpoznávání naleznete v části Možnosti OCR.

Volba barevného režimu:

  • Použijte rozevírací seznam Barevný režim v dialogovém okně Úloha nebo
  • Zvolte jednu z možností pod názvem Barevný režim v kartě Dokument dialogového okna Možnosti (Nástroje > Možnosti…).

Důležité! Po převodu dokumentu na černobílý již nelze barvy obnovit. Pro získání barevného dokumentu otevřete soubor s barevnými obrázky nebo papírový dokument naskenujte v barevném režimu.

14.01.2020 17:26:18


Please leave your feedback about this article