Obsahuje-li vytištěný dokument nestandardní písma

Pokud dokument, který chcete rozpoznat, obsahuje ozdobná písma a speciální znaky (např. matematické symboly), doporučujeme použít režim výuky, aby se zvýšila přesnost rozpoznávání.

Nedoporučuje se používat režim výuky v jiných případech, protože přínos z hlediska kvality rozpoznávání bude málo významný v porovnání s množstvím času a úsilí věnovaného výuce.

V režimu výuky se vytvoří uživatelský vzor. Tento uživatelský vzor je poté použit při rozpoznávání OCR, a to na celý text.

Používání uživatelských vzorů

Použití uživatelského vzoru k rozpoznání dokumentu:

  1. Klikněte na Nástroje > Možnosti... a otevře se dialogové okno Možnosti. Klikněte na záložku OCR.
  2. Zvolte možnost Použít uživatelské vzory.
    Pokud je vybrána možnost Použít i vestavěné vzory pod možností Použít uživatelské vzory, aplikace ABBYY FineReader použije vestavěné vzory i uživatelské vzory, které byly vytvořeny.
  3. Klikněte na tlačítko Editor vzoru....
  4. V podokně Editor vzoru zvolte vzor a klikněte na OK.
  5. Klikněte na tlačítko na hlavním panelu nástrojů v horní části okna editoru OCR.

Vytvoření a výuka uživatelského vzoru

Postup výuky uživatelského vzoru rozpoznávání nových znaků a vazeb:

  1. Klikněte na Nástroje > Možnosti... a otevře se dialogové okno Možnosti. Klikněte na záložku OCR.
  2. Zvolte možnost Použít výuku pro rozpoznávání nových znaku a vazeb.
    Pokud je vybrána možnost Použít i vestavěné vzory pod možností Použít výuku pro rozpoznávání nových znaku a vazeb, aplikace ABBYY FineReader použije vestavěné vzory i uživatelské vzory, které byly vytvořeny.
  3. Klikněte na tlačítko Editor vzoru....
    Výuka vzorů není podporována u asijských jazyků.
  4. V podokně Editor vzoru, klikněte na tlačítko Nový....
  5. V podokně Vytvořit vzor zadejte název nového vzoru a klikněte na OK.
  6. Klikněte na OK v podokně Editor vzoru a poté klikněte na OK v podokněMožnosti.
  7. Klikněte na tlačítko na panelu nástrojů v podokně Obrázek.
    Pokud program nalezne znak, který nedokáže rozpoznat, otevře se dialog Vzor výuky a zobrazí tento znak.
  8. Chcete-li program naučit číst nové znaky a vazby.
    Vazba je kombinace dvou nebo tří znaků, které jsou spojeny dohromady (např. fi, fl, ffi atd.) a pro program je složité je oddělit. Lepších výsledků dosáhnete, pokud s nimi zacházíte jako s jediným složeným znakem.
    Pokud se v textu nachází tučné písmo nebo kurzíva či slova s horním nebo dolním indexem a vy chcete tyto efekty zachovat v rozpoznaném textu, odpovídající možnosti vyberte v části Efekty.
    Pro návrat k předchozímu naučenému znaku klikněte na tlačítko Zpìt. Rámeček přeskočí na předchozí místo a poslední zkoušená kombinace „obraz znaku –znak na klávesnici“ bude ze vzoru odstraněna. Podokno Zpìt provádí pohyb mezi znaky jednoho slova, a nikoli mezi různými slovy.

Důležité!

  • Aplikaci ABBYY FineReader PDF můžete naučit číst pouze znaky, které jsou součástí abecedy jazyka OCR. Abyste program naučili číst znaky, které nelze zadat z klávesnice, použijte k označení těchto neexistujících znaků kombinaci dvou znaků, nebo požadovaný znak zkopírujte z dialogového okna Vložit znak (klikněte na , aby se toto dialogové okno otevřelo).
  • Každý vzor může obsahovat až 1 000 nových znaků. Vyvarujte se však vytváření příliš velkého počtu vazeb, protože by to mohlo mít nepříznivý dopad na kvalitu OCR.

Výběr uživatelského vzoru

U aplikace ABBYY FineReader můžete používat vzory ke zvýšení kvality OCR.

  1. Klikněte na Nástroje > Editor vzoru....
  2. V podokně Editor vzoru (dialogovém okně) vyberte jeden ze vzorů ze seznamu a klikněte na tlačítko Nastavit jako aktivní.

Některé důležité body k zapamatování:

  1. Program někdy nerozliší velmi podobné, ale přesto rozdílné znaky. Rozpozná je jako stejný znak. Například anglické jednoduché rovné ('), levé (‘) a pravé (’) uvozovky budou ve vzoru uloženy jako jeden znak (rovné uvozovky). To znamená, že pravé a levé uvozovky se v rozpoznaném textu nikdy neobjeví, i kdybyste se snažili je program naučit.
  2. V případě obrazů některých znaků vybere aplikace ABBYY FineReader PDF znak na klávesnici, který odpovídá kontextu. Například obraz malého kroužku bude rozpoznán jako písmeno O, pokud jsou hned vedle něj písmena, a jako číslice 0, pokud jsou kolem číslice.
  3. Vzor lze použít pouze pro dokumenty se stejným písmem, velikostí písma a rozlišením jako u dokumentů použitých k vytvoření vzoru.
  4. Vzor můžete uložit do souboru a použít ho v dalších projektech OCR. Viz také: Projekty OCR.
  5. Chcete-li rozpoznat texty v jiném typu písma, vypněte uživatelský vzor. To lze provést kliknutím na Nástroje > Možnosti... a otevře se dialogové okno Možnosti, klikněte na záložku OCR a zvolte možnost Použít vestavěné vzory.

Úprava uživatelského vzoru

Před spuštěním procesu OCR se můžete rozhodnout k úpravě nově vytvořeného vzoru. Nesprávně naučený vzor může mít nepříznivý vliv na kvalitu OCR. Jakýkoli vzor by měl obsahovat pouze celé znaky nebo vazby. Znaky s oříznutými hranami a znaky s nesprávnými páry písmen by měly být ze vzoru odstraněny.

  1. Klikněte na Nástroje > Editor vzoru....
  2. V podokně Editor vzoru (dialogovém okně) zvolte vzor, který chcete upravit, klikněte na tlačítko Upravit....
  3. V podokně Uživatelský vzor (dialogovém okně) zvolte znak a klikněte na tlačítko Vlastnosti....

V dialogovém okně, které se otevře:

  • V podokně Znak (poli) zadejte písmeno odpovídající znaku.
  • V podokně Efekt (poli) zadejte požadovaný efekt písma (tučné, kurzíva, horní index, dolní index).

Chcete-li odstranit nesprávně naučený znak, klikněte na tlačítko Odstranit v dialogovém okně Uživatelský vzor.

12.06.2024 14:29:12

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.