Práca so zložitými skriptovacími jazykmi (Complex Script Languages)

S programom ABBYY FineReader môžete rozpoznávať aj texty v arabčine, hebrejčine, jidiš, thajčine, čínštine, japončine a kórejčine. Pri práci s dokumentmi v čínštine, japončine alebo kórejčine a dokumentmi, kde sa používa kombinácia jazyka CJK a európskeho jazyka, je potrebné ešte o niečo viac opatrnosti.

Inštalovanie podpory jazyka

Aby ste mohli rozpoznávať texty písané v arabčine, hebrejčine, jidiš, thajčine, čínštine, japončine a kórejčine, budete možno potrebovať nainštalovať tieto jazyky.

Operačné systémy Windows 8, Windows 7 a Windows tieto jazyky podporujú štandardne.

Inštalácia nových jazykov v operačnom systéme Microsoft Windows XP:

  1. Kliknite na Štart na paneli úloh.
  2. Kliknite na Ovládací panel > Miestne a jazykové nastavenia.
  3. Kliknite na kartu Jazyky a vyberte nasledujúce možnosti:
    • Nainštalujte si súbory pre jazyky s písmom so zložitým zápisom a jazykov písaných sprava doľava (vrátane thajčiny)

, aby ste získali podporu arabčiny, hebrejčiny, jidiš a thajčiny.

  • Nainštalovať súbory pre východoázijské jazyky

na umožnenie podpory japončiny, čínštiny a kórejčiny

  1. Kliknite na OK.

Odporúčané písma

Rozpoznávanie textu v arabčine, hebrejčine, jidiš, thajčine, čínštine, japončine a kórejčine si môže vyžadovať inštaláciu prídavných písiem v systéme Windows. Tabuľka uvedená nižšie obsahuje zoznam odporúčaných písem na prácu v týchto jazykoch.

Jazyk OCR Odporúčané písmo
Arabský Arial™ Unicode™ MS*
Hebrejský Arial™ Unicode™ MS*
Jidiš Arial™ Unicode™ MS*
Thajský

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Čínština (zjednodušená),

čínština (tradičná),

japončina, kórejčina,

kórejčina (Hangul)

Arial™ Unicode™ MS*

Písma SimSun

napríklad: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming (pre ISO10646)

STSong

* Toto písmo sa nainštaluje spoločne s operačným systémom Microsoft Windows XP a programovým balíkom Microsoft Office 2000 alebo novšími verziami.

Nasledujúce časti obsahujú odporúčania na zlepšenie presnosti rozpoznávania.

Deaktivovať automatické spracovanie

Štandardne sa automaticky rozpoznajú všetky strany pridané do dokumentu programu ABBYY FineReader.

V prípade, že dokument obsahuje kombináciu textu napísaného v jazyku CJK spolu s textom v európskom jazyku, odporúčame, aby ste funkciu automatického rozpoznávania orientácie strany deaktivovali a možnosť rozdelenia dvojstrán používali len v takom prípade, ak majú všetky strany snímky správnu orientáciu (napr. neboli naskenované hore nohami).

Možnosti Zistiť orientáciu strany a Rozdeliť dvojstrany je možné aktivovať a deaktivovať priamo na karte Skenovať/Otvoriť dialógového okna Možnosti.

Poznámka: Ak chcete rozdeliť dvojstrany napísané v arabčine, hebrejčine alebo jidiš, nezabudnite najprv vybrať príslušný jazyk rozpoznávania a až potom vyberte možnosť Rozdeliť dvojstrany. Tak sa zaistí, že strany budú usporiadané v správnom poradí. Číslovanie strán pôvodného dokumentu môžete obnoviť aj výberom možnosti Vymeniť strany knihy. Podrobné informácie nájdete v časti "Čo je to dokument programu FineReader?"

Ak je štruktúra vášho dokumentu zložitejšia, odporúčame deaktiváciu automatickej analýzy a rozpoznávania OCR a ručné vykonanie týchto úkonov.

Deaktivácia automatickej analýzy a rozpoznávania OCR:

  1. Otvorte dialógové okno Možnosti (Nástroje >Možnosti…).
  2. Zrušte začiarknutie možnosti Automaticky spracovať strany pri ich pridaní na karte Skenovať/Otvoriť.
  3. Kliknite na OK.

Rozpoznávanie dokumentov napísaných vo viacerých jazykoch

V pokynoch nižšie bol ako príklad použitý dokument s textom v angličtine a čínštine.

  1. Na hlavnom paneli s nástrojmi vyberte Ďalšie jazyky… v rozbaľovacom zozname Jazyky dokumentu. Vybrať Určiť jazyky ručne z dialógového okna Editor jazykov a zo zoznamov jazykov vyberte čínštinu a angličtinu.
  2. Skenovať alebo otvoriť snímky.
  3. Ak program nedokáže rozpoznať niektoré oblasti na snímke:
    • Zadajte oblasti manuálne pomocou nástrojov na úpravu oblasti.
    • Zadajte všetky oblasti, ktoré obsahujú len jeden jazyk. Ak chcete tak urobiť, vyberte ich a určite ich jazyk v table Vlastnosti oblasti.

Dôležité upozornenie! Jazyk môže byť zadaný iba pre oblasti rovnakého typu. Ak si vyberiete oblasti rôzneho typu, ako je Text a Tabuľka, nebudete môcť určiť jazyk.

  1. Kliknite na tlačidlo Čítať na hlavnom paneli nástrojov.

Ak sa nezobrazujú neeurópske znaky v okne Text

Ak jazyk CJK nie je správne zobrazený v okne Text, možno ste vybrali režim Iba text.

Zmena písma použitého v režime Iba text:

  1. Otvorte dialógové okno Možnosti (Nástroje >Možnosti…).
  2. Kliknite na kartu Zobraziť.
  3. Vyberte Arial Unicode MS z rozbaľovacieho zoznamu Písmo použité na zobrazovanie obyčajného textu.
  4. Kliknite na OK.

Ak to nepomohlo a ak sa text v okne Text stále zobrazuje nesprávne, pozrite si časť "Pri výmene niektorých znakov za "?" alebo "□" v okne Text."

Zmena smeru rozpoznaného textu

Program ABBYY FineReader zisťuje smer textu automaticky, ale smer textu môžete určiť aj manuálne.

  1. Vyberte jeden alebo viac odsekov v okne Text.
  2. Kliknite na tlačidlo na paneli nástrojov v hornej časti okna Text.

Poznámka: Môžete použiť rozbaľovací zoznam Smer textu CJK v okne Snímka a zadať pred rozpoznávaním smer textu. Podrobnosti sú uvedené v časti Zvislý alebo invertovaný text nebol rozpoznaný správne.

1/14/2020 5:26:21 PM


Please leave your feedback about this article