Obsahuje-li vytištěný dokument nestandardní písma

Režim Výuky zvyšuje kvalitu rozpoznávání OCR u dokumentů s ozdobnými písmy nebo dokumentů se speciálními znaky (např. matematickými symboly).

Poznámka: Nedoporučuje se používat režim výuky v jiných případech, protože přínosy z hlediska kvality rozpoznávání budou málo významné v porovnání s množstvím času a úsilí věnovaného výuce.

V režimu Výuky se vytvoří uživatelský vzor, který lze při rozpoznávání OCR použít na celý text.

Používání uživatelských vzorů

Použití vzoru k rozpoznávání dokumentu:

  1. Otevřete dialogové okno Možnosti (Nástroje>Možnosti…) a klikněte na kartu Číst.
  2. Pod položkou Výuka vyberte možnost Použít jen uživatelský vzor.

Poznámka: Pokud vyberete možnost Používat vestavěné i uživatelské vzory, aplikace ABBYY FineReader 12 použije uživatelské vzory i přednastavené vzory rozpoznávání OCR.

  1. Klikněte na tlačítko Editor vzoru….
  2. V dialogovém okně Editor vzoru vyberte požadovaný vzor a klikněte na tlačítko OK.
  3. V hlavním okně aplikace ABBYY FineReader klikněte na tlačítko Číst.

Vytvoření a výuka uživatelského vzoru

Postup výuky uživatelského vzoru rozpoznávání nových znaků a vazeb:

  1. Otevřete dialogové okno Možnosti (NástrojeMožnosti…) a klikněte na kartu Číst.
  2. Pod položkou Výuka vyberte možnost Používat vestavěné i uživatelské vzory nebo Použít jen uživatelský vzor.
  3. Vyberte možnost Číst s výukou.
  4. Klikněte na tlačítko Editor vzoru….

Poznámka: Výuka vzorů není podporována u asijských jazyků.

  1. V dialogovém okně Editor vzoru klikněte na položku Nový…
  2. Otevře se dialogové okno Vytvořit vzor. Zadejte název uživatelského vzoru a klikněte na tlačítko OK.
  3. Zavřete dialogová okna Editor vzoru a Možnosti kliknutím na tlačítko OK v každém z nich.
  4. Na panelu nástrojů v horní části okna Obraz klikněte na možnost Číst.

Pokud nyní aplikace ABBYY FineReader narazí na neznámý znak, v dialogovém okně Vzor výuky se neznámý znak zobrazí.

  1. Učte program číst nové znaky a vazby.

Vazba je kombinace dvou nebo tří znaků, které jsou "spojeny dohromady" (např. fi, fl, ffi atd.) a pro program je složité je oddělit. Lepších výsledků dosáhnete, pokud s nimi zacházíte jako s jediným složeným znakem.

Poznámka: Pokud se v textu nachází tučné písmo nebo kurzíva či slova s horním nebo dolním indexem a vy chcete tyto efekty zachovat v rozpoznaném textu, odpovídající možnosti vyberte v části Efekty.

Pro návrat k předchozímu naučenému znaku klikněte na tlačítko Zpět. Rámeček přeskočí na předchozí lokaci a poslední naučená shoda "obraz znaku – znak na klávesnici" bude ze vzoru odstraněna. Tlačítko Zpět provádí pohyb mezi znaky jednoho slova, a nikoli mezi různými slovy.

Důležité!

  • Aplikaci ABBYY FineReader můžete naučit číst pouze znaky, které jsou součástí abecedy jazyka rozpoznávání. Abyste program naučili číst znaky, které nelze zadat z klávesnice, použijte k označení těchto neexistujících znaků kombinaci dvou znaků, nebo požadovaný znak zkopírujte z dialogového okna Vložit znak (dialogové okno otevřete kliknutím na tlačítko   ).
  • Každý vzor může obsahovat až 1000 nových znaků.  Vzhledem k nepříznivým vlivům na kvalitu rozpoznávání OCR se však vyhněte vytváření příliš mnoha vazeb.

Výběr uživatelského vzoru

Aplikace ABBYY FineReader pro zvýšení kvality funkce OCR umožňuje používat vzory.

  1. V nabídce Nástroje klikněte na položku Editor vzoru….
  2. V dialogovém okně Editor vzoru vyberte ze seznamu dostupných vzorů požadovaný vzor a klikněte na možnost Nastavit jako aktivní.

Některé důležité body k zapamatování:

  1. Aplikace ABBYY FineReader nerozlišuje mezi některými podobnými znaky, které jsou však různé. Rozpoznává je jako stejný znak. Například rovné ('), levé (‘) a pravé (’) uvozovky budou ve vzoru uloženy jako jeden znak (rovná uvozovka). To znamená, že levé a pravé uvozovky nebudou v rozpoznaném textu nikdy použity, ani když je zkusíte program naučit.
  2. V případě obrazů některých znaků vybere aplikace ABBYY FineReader znak na klávesnici, který odpovídá kontextu. Například obraz malého kroužku bude rozpoznán jako písmeno O, pokud jsou hned vedle něj písmena, a jako číslice 0, pokud jsou kolem číslice.
  3. Vzor lze použít pouze pro dokumenty se stejným písmem, velikostí písma a rozlišením jako u dokumentů použitých k vytvoření vzoru.
  4. Abyste mohli některý vzor použít znovu, uložte jej do některého souboru. Podrobnosti naleznete v části "Co je dokument aplikace FineReader?"
  5. Chcete-li rozpoznávat texty psané jiným písmem, zkontrolujte, zda je zakázán uživatelský vzor prostřednictvím výběru možnosti Použít jen vestavěné vzory v položce Nástroje > Možnosti… > Číst.

Úprava uživatelského vzoru

Před spuštěním procesu optického rozpoznávání znaků (OCR) můžete chtít nově vytvořený vzorupravit. Nesprávně naučený vzor může mít na kvalitu rozpoznávání OCR nepříznivý účinek. Vzor by měl obsahovat pouze celé znaky nebo vazby. Znaky s oříznutými hranami a znaky nesprávných písmen by se měly ze vzoru odstranit.

  1. V nabídce Nástroje klikněte na položku Editor vzoru….
  2. Otevře se dialogové okno Editor vzoru. Vyberte požadovaný vzor a klikněte na tlačítko Upravit….
  3. V otevřeném dialogovém okně Uživatelský vzor vyberte znak a klikněte na tlačítko Vlastnosti….

V dialogovém okně, které se otevře:

  • Zadejte písmeno, které odpovídá znaku, a to do pole Znak
  • Zadejte požadovaný efekt písma (tučné, kurzíva, horní index a dolní index) do pole Efekt.

Klikněte na tlačítko Odstranit v dialogovém okně Uživatelský vzor a odstraňte znak, který nebyl naučen správně.

14.01.2020 17:26:18


Please leave your feedback about this article