Pokud program nedokáže rozpoznat určité znaky

Aplikace ABBYY FineReader 14 používá při rozpoznávání textu data o jazyku dokumentu. Program nemusí být schopen rozpoznat některé znaky v dokumentech s neznámými prvky (např. číselnými kódy), protože jazyk dokumentu tyto znaky nemusí obsahovat. Pro rozpoznávání takových dokumentů můžete vytvořit vlastní jazyk se všemi nezbytnými znaky. Můžete také vytvářet skupiny několika jazyků OCR a používat tyto skupiny při rozpoznávání dokumentů.

Jak vytvořit uživatelský jazyk

  1. Otevřete dialogové okno Možnosti (klikněte na Nástroje > Možnosti..., aby se toto dialogové okno otevřelo). Klikněte na záložku Jazyky.
  2. Klikněte na tlačítko Nový....
  3. V následně otevřeném dialogovém okně vyberte možnost Vytvořit nový jazyk na základě existujícího jazyka a zvolte jazyk, který chcete použít jako základ pro nový jazyk. Poté klikněte na OK.
  4. Otevře se dialogové okno Vlastnosti jazyků. V tomto dialogovém okně:
    1. Zadejte název nového jazyka.
    2. Jazyk zvolený v dialogovém okně Nový jazyk nebo skupina se zobrazí v rozevíracím seznamu Zdrojový jazyk. Z tohoto rozevíracího seznamu můžete vybrat jiný jazyk.
    3. Podokno Abeceda obsahuje abecedu základního jazyka. Chcete-li abecedu upravit, klikněte na tlačítko .
    4. Skupina možností Slovník obsahuje několik možností, které program používá při rozpoznávání textu a kontrole výsledků:
      • Žádný
        Jazyk nebude mít slovník.
      • Vestavěný slovník
        Bude použit vestavěný slovník programu.
      • Uživatelský slovník
        Klikněte na tlačítko Upravit... a zadejte slovníkové termíny nebo importujte stávající vlastní slovník, případně textový soubor s kódováním Windows-1252 (termíny musejí být odděleny mezerami nebo jinými neabecedními znaky).
        Slova z uživatelského slovníku nebudou při kontrole pravopisu rozpoznaného textu označena jako nesprávná. Mohou být napsána malými i velkými písmeny a mohou začínat velkým písmenem.
Slovo ve slovníku Slova, která nebudou při kontrole pravopisu považována za chybná
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Podokno Běžný výraz umožňuje vytvořit uživatelský slovník s použitím regulárních výrazů.
    Viz také: Regulární výrazy.
  1. Jazyky mohou mít několik dodatečných vlastností. Pokud chcete tyto vlastnosti změnit, klikněte na tlačítko Zdokonalený... a otevře se dialogové okno Zdokonalené vlastnosti jazyka, kde lze zadat:
    • Znaky, jimiž může slovo začínat či končit
    • Nepísmenné znaky vyskytující se odděleně od slov
    • Znaky, které se mohou ve slovech vyskytnout, ale mají být ignorovány
    • Znaky, které se nesmějí vyskytovat v textech, které jsou rozpoznávány s využitím tohoto jazyka (zakázané znaky)
    • Možnost Text může obsahovat arabské číslice, římské číslice a zkratky.
  2. Nyní můžete při výběru jazyků OCR zvolit nově vytvořený jazyk.
    Více informací o jazycích OCR naleznete v kapitole Jazyky OCR.

Ve výchozím nastavení se uživatelský jazyk ukládá do složky projektu OCR. Všechny uživatelské vzory a jazyky můžete uložit i jako jeden soubor. Pokud to chcete udělat,otevřete dialogové okno Možnosti (klikněte naNástroje > Možnosti..., aby se toto dialogové okno otevřelo). Klikněte na záložku OCR a poté klikněte na tlačítko Uložit vzory a jazyky....

Vytvoření jazykové skupiny

Pokud se chystáte používat určitou jazykovou kombinaci pravidelně, možná budete chtít mít dané jazyky pohodlně v jedné skupině.

  1. Otevřete dialogové okno Možnosti (klikněte na Nástroje > Možnosti..., aby se toto dialogové okno otevřelo). Klikněte na záložku Jazyky.
  2. Klikněte na tlačítko Nový....
  3. V dialogovém okně Nový jazyk nebo skupina zvolte možnost Vytvořit novou skupinu jazyků a klikněte na OK.
  4. Otevře se dialogové okno Vlastnosti jazykové skupiny. V tomto dialogovém okně zadejte název jazykové skupiny a vyberte jazyky, které do dané skupiny chcete zařadit.
    Pokud víte, že váš text nebude určité znaky obsahovat, můžete tyto tzv. zakázané znaky určit. Tím se zvýší rychlost a přesnost OCR. Pokud chcete tyto znaky zadat, klikněte na tlačítko Zdokonalený... v dialogovém okně Vlastnosti jazykové skupiny a zadejte zakázané znaky do pole Zakázané znaky.
  5. Klikněte na OK.

Nová skupina se objeví v rozevíracím seznamu jazyků na hlavním panelu nástrojů.

Ve výchozím nastavení jsou jazykové skupiny uloženy ve složce dokumentů Projekt OCR. Všechny uživatelské vzory a jazyky můžete uložit i jako jeden soubor. Pokud to chcete udělat,otevřete dialogové okno Možnosti (klikněte na Nástroje > Možnosti..., aby se toto dialogové okno otevřelo). Klikněte na záložku OCR a poté klikněte na tlačítko Uložit vzory a jazyky....

Tip. Pro výběr skupiny jazyků můžete použít rozevírací seznam jazyků na hlavním panelu nástrojů.

  1. Vyberte Další jazyky... z rozevíracího seznamu jazyků na hlavním panelu nástrojů.
  2. V dialogovém okně Jazykový editor zvolte možnost Zadat jazyky OCR ručně.
  3. Vyberte požadované jazyky a klikněte na OK.

02.11.2018 16:19:14


Please leave your feedback about this article