Možnosti OCR

Volba správných možností rozpoznávání (OCR) je důležitá, pokud chcete rychle dosáhnout přesných výsledků. Při rozhodování, které možnosti chcete použít, byste neměli zvažovat jen typ a složitost dokumentu, ale také to, jak chcete výsledky používat. K dispozici jsou následující skupiny možností:

Možnosti OCR můžete najít na kartě OCR dialogového okna Možnosti (klikněte na Nástroje > Možnosti..., aby se toto dialogové okno otevřelo).

Aplikace ABBYY FineReader automaticky rozpozná všechny stránky, které do projektu OCR přidáte. Pro OCR budou použity aktuálně zvolené možnosti. Automatickou analýzu a OCR nově přidaných obrazů můžete vypnout na kartěZpracování obrazů dialogového okna Možnosti (klikněte na Nástroje > Možnosti..., aby se toto dialogové okno otevřelo).

Pokud možnosti OCR změníte až po rozpoznání dokumentu, pro rozpoznání dokumentu s novými možnostmi spusťte proces OCR znovu.

Režimy rozpoznávání PDF

Tato nastavení jsou určena pro dokumenty PDF obsahující textovou vrstvu a obrázky. Takové dokumenty PDF jsou obvykle vytvořeny z dokumentů ve formátech s možností úprav. Ostatní typy dokumentů PDF, např. PDF s možností vyhledávání a čistě obrazové PDF, se vždy zpracovávají v režimu Použít OCR, což je výchozí režim pro tyto typy souboru PDF. Pro zpracování takových souborů PDF nejsou nutná žádná další nastavení.

K dispozici jsou tři režimy rozpoznávání:

    • Automaticky volit mezi OCR a textem z PDF
      Program prozkoumá textovou vrstvu a použije stávající textovou vrstvu, pokud obsahuje text v dobré kvalitě. Jinak se použije OCR k vytvoření nové textové vrstvy.
    • Použít OCR
      K vytvoření nové textové vrstvy se použije OCR. Zpracovávání v tomto režimu trvá déle, ale jeho použití je vhodnější pro dokumenty s nekvalitními textovými vrstvami.
    • Použít pouze text z PDF
      Jde o výchozí režim pro dokumenty PDF s textovými vrstvami. Program použije původní textovou vrstvu bez spuštění OCR.

Vyváženost rychlosti a přesnosti OCR

ABBYY FineReader 14 umožňuje provádění následujících činností:

  • Důkladné rozpoznávání
    V tomto režimu aplikace ABBYY FineReader analyzuje a rozpoznává jednoduché dokumenty i dokumenty se složitým rozvržením, a dokonce i dokumenty s barevným textem na barevném pozadí, dokumenty se složitými tabulkami (včetně tabulek s bílými rastrovými čarami a barevnými buňkami).
    Důkladné rozpoznávání vyžaduje více času, ale výsledkem je vyšší kvalita.
  • Rychlé rozpoznávání
    Tento režim se doporučuje pro zpracování velkých dokumentů s jednoduchým rozvržením a dobrou kvalitou obrazů.

Typ tisku

Určuje typ zařízení, které bylo použito k tisku dokumentu. Viz také: Vlastnosti dokumentů, které je nutno vzít v úvahu před rozpoznáváním OCR.

Zjišťování strukturálních prvků

Vyberte strukturální prvky, které má program zjišťovat: záhlaví, zápatí, poznámky pod čarou, obsahy a seznamy. Vybrané prvky budou po uložení dokumentu interaktivní (bude na ně možno kliknout).

Čárové kódy

Pokud váš dokument obsahuje čárové kódy, které chcete převést na sekvenci písmen a číslic, a nikoli na obrázek, vyberte možnost Převést čárové kódy na řetězce. Tato funkce je ve výchozím nastavení vypnuta.

Vzory a jazyky

Rozpoznávání s výukou se používá při rozpoznávání následujících typů textu:

  • Text se speciálními symboly (např. matematickými)
  • Text s ozdobnými prvky
  • Velké objemy textu z obrazů nízké kvality (přes 100 stran)

Výuka je ve výchozím nastavení zakázána. Povolte Použít výuku pro rozpoznávání nových znaku a vazeb, chcete-li provádění OCR spojit s výukou aplikace ABBYY FineReader.

Při rozpoznávání můžete používat vestavěné nebo uživatelské vzory.

Nastavení uživatelských vzorů a jazyků můžete ukládat i načítat. Viz také: Projekt OCR.

Písma

Zde můžete volit písma, která budou použita při ukládání rozpoznaného textu.

Výběr písma:

  1. Klikněte na tlačítko Vybrat písma....
  2. Vyberte požadovaná písma a klikněte na OK.

11/2/2018 4:19:14 PM


Please leave your feedback about this article