Práce s jazyky se složitým písmem

S aplikací ABBYY FineReader lze rozpoznávat dokumenty v arabštině, hebrejštině, jidiš, thajštině, čínštině, japonštině a korejštině. Při práci s dokumenty v čínštině, japonštině a korejštině a s dokumenty, v nichž je použita kombinace těchto tří jazyků s jazyky evropskými, je nutno brát v úvahu další faktory.

Instalace podpory jazyka

Chcete-li rozpoznávat texty v arabštině, hebrejštině, jidiš, thajštině, čínštině, japonštině a korejštině, musí se tyto jazyky nainstalovat.

Operační systémy Microsoft Windows 8, Windows 7, a Windows Vista tyto jazyky podporují ve výchozím nastavení.

Instalace nových jazyků v systému Microsoft Windows XP:

  1. Na panelu úloh klikněte na tlačítko Start.
  2. Klikněte na položku Ovládací panel > Místní a jazykové nastavení.
  3. Klikněte na kartu Jazyky a zvolte následující možnosti:
    • Instalovat soubory jazyků se složitým písmem nebo psaním zprava doleva (včetně thajštiny)

pro podporu arabštiny, hebrejštiny, jidiš a thajštiny

  • Instalovat soubory pro východoasijské jazyky

pro podporu japonštiny, čínštiny a korejštiny

  1. Klikněte na tlačítko OK.

Doporučené druhy písma

Rozpoznávání textů v arabštině, hebrejštině, jidiš, thajštině, čínštině, japonštině a korejštině může vyžadovat instalaci dalších písem v operačním systému Windows. Níže uvedená tabulka uvádí doporučená písma pro texty v těchto jazycích.

Jazyk OCR Doporučený druh písma
Arabština Arial™ Unicode™ MS*
Hebrejština Arial™ Unicode™ MS*
Jidiš Arial™ Unicode™ MS*
Thajština

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Čínština (zjednodušená),

čínština (tradiční),

japonština, korejština,

korejština (hangul)

Arial™ Unicode™ MS*

Písma SimSun

, např.: SimSun (prodloužené písmo), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(for-ISO10646)

STSong

* Toto písmo se instaluje společně se systémy Microsoft Windows XP a Microsoft Office 2000 nebo novějšími.

Níže uvedené části obsahují rady ohledně zvýšení přesnosti rozpoznávání.

Zakázání automatického zpracování

Ve výchozím nastavení se automaticky rozpoznávají všechny stránky vložené do dokumentu aplikace ABBYY FineReader.

Pokud však dokument obsahuje text tvořený písmem čínštiny, korejštiny nebo japonštiny v kombinaci s evropským jazykem, doporučujeme zakázat automatické zjišťování orientace stránky a možnost rozdělení dvojstran použít jen tehdy, když mají všechny obrazy stránek správnou orientaci (např. nejsou skenovány obráceně).

Možnosti Zjistit orientaci stránky a Rozdělit protilehlé stránky lze povolit a zakázat na kartě Skenovat/Otevřít v dialogovém okně Možnosti.

Poznámka: Pro rozdělení protilehlých stran v arabštině, hebrejštině nebo v jidiš nezapomeňte nejprve zvolit odpovídající jazyk rozpoznávání, a teprve poté zvolte možnost Rozdělit protilehlé stránky. Takto zajistíte, že budou stránky seřazeny ve správném pořadí. Původní číslování stránek můžete také obnovit volbou možnosti Přepnout stránky knihy. Podrobnosti viz "Co je dokument aplikace FineReader?"

Má-li dokument složitou strukturu, doporučujeme zakázat automatickou analýzu a OCR obrazů, a provádět tyto operace ručně.

Postup zakázání automatické analýzy a OCR :

  1. Otevřete dialogové okno Možnosti (Nástroje > Možnosti…).
  2. Zrušte možnost Stránky automaticky zpracovávat tak, jak jsou přidávány v kartě Skenovat/Otevřít.
  3. Klikněte na tlačítko OK.

Převod dokumentů napsaných ve více jazycích

V následujících pokynech je jako příklad použit dokument obsahující anglický i čínský text.

  1. V hlavním panelu nástrojů vyberte Další jazyky… z rozevíracího seznamu Jazyky dokumentu. Vyberte Zadat jazyky ručně v dialogovém okně Jazykový editor a ze seznamu jazyků vyberte čínštinu a angličtinu.
  2. Skenujte nebo otevírejte obrazy.
  3. Nerozpozná-li program všechny oblasti obrazu:
    • Zadejte oblasti ručně prostřednictvím nástrojů pro úpravu oblastí.
    • Zadejte jakékoli oblasti obsahující pouze jeden jazyk. Aby to bylo možné, vyberte je a zadejte jejich jazyk v podokně Vlastnosti oblasti.

Důležité! Můžete zadat jazyk jen pro oblasti stejného typu. Pokud jste zvolili oblasti různých typů, např.Text nebo Tabulka, jazyk nebude možné zadat.

  1. Klikněte na tlačítko Číst na hlavním panelu nástrojů.

Pokud se neevropské znaky nezobrazují v okně Text

Pokud se nějaký jazyk ze skupiny CJK (čínština, japonština a korejština) v okně Text nezobrazil správně, možná byl zvolen režim Nešifrovaný text.

Pro změnu písma použitého v režimu Nešifrovaný text:

  1. Otevřete dialogové okno Možnosti (Nástroje > Možnosti…).
  2. Klikněte na kartu Zobrazit.
  3. Vyberte Arial Unicode MS z rozevíracího seznamu Písmo použité k zobrazení prostého textu.
  4. Klikněte na tlačítko OK.

Nepomohlo-li to a text v okně Text není zobrazen správně, podívejte se do části "Jsou-li některé znaky nahrazeny znaky "?" nebo "□" v okně Text."

Změna směru rozpoznaného textu

Aplikace ABBYY FineReader automaticky zjišťuje směr textu, ale můžete jej zadat i ručně.

  1. V okně Text vyberte jeden nebo více odstavců.
  2. Klikněte na tlačítko na panelu nástrojů v okně Text.

Poznámka: Můžete použít rozevírací seznam Směr textu CJK v okně Obraz a zadat v něm směr textu ještě před rozpoznáváním. Viz Pokud není svislý nebo invertovaný text rozpoznán.

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.