Tootamine keerulise kirjaga keeltega

ABBYY FineReader võimaldab tuvastada dokumente araabia, heebrea, jiidiši, tai, hiina, jaapani ja korea keeles. Töötades hiina-, jaapani- või koreakeelsete dokumentidega, milles kasutatakse hieroglüüfkeele ja Euroopa keelte kombinatsiooni, tuleb arvestada mõne täiendava asjaoluga.

Keeletoe installimine

Võimalik, et araabia, heebrea, jiidiši, tai, hiina, jaapani ja korea keeles kirjutatud tekstide tuvastamiseks pead installima need keeled eraldi.

Microsoft Windows 8, Windows 7 ja Windows Vista toetavad neid keeli vaikimisi.

Uute keelte installimiseks Microsoft Windows XP-s toimi järgmiselt.

  1. Klõpsa nuppu Start tööriistaribal.
  2. Klõpsa Juhtpaneel > Regiooni ja keele suvandid.
  3. Klõpsa vahekaarti Keeled ja vali järgmised suvandid:
    • Installi keerulise kirja ja paremalt-vasakule suunaga keelte (kaasa arvatud tai) failid

, et saada araabia, heebrea, jiidiši ja tai keele tugi

  • Installi Ida-Aasia keelte failid

, et saada jaapani, hiina ja korea keele tugi.

  1. Klõpsa nuppu OK.

Soovitatavad fondid

Võimalik, et araabia, heebrea, jiidiši, tai, hiina, jaapani ja korea keeles kirjutatud tekstide tuvastamiseks pead installima täiendavaid fonte Windowsis. Järgmises tabelis on toodud soovitatavate fontide loend nendes keeltes kirjutatud tekstidele.

Optilise tekstituvastuse keel Soovitatav font
Araabia Arial™ Unicode™ MS*
Heebrea Arial™ Unicode™ MS*
Jiidiš Arial™ Unicode™ MS*
Tai

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Hiina (lihtsustatud),

hiina (traditsiooniline),

jaapani, korea,

korea (hanguli)

Arial™ Unicode™ MS*

SimSuni fondid

, nt: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming (ISO10646 jaoks)

STSong

* See font installitakse koos Microsoft Windows XP-ga ja Microsoft Office 2000 või uuema versiooniga.

Järgmised jaotised sisaldavad nõuandeid tuvastustäpsuse parandamiseks.

Automaatse kujutisetöötluse keelamine

Vaikimisi tuvastatakse automaatselt kõik leheküljed, mis ABBYY FineReaderi dokumenti lisatakse.

Ent kui dokument sisaldab hieroglüüfkeelt koos mõne Euroopa keelega, soovitame automaatse lehekülje paigutuse tuvastamise välja lülitada ja kasutada ainult lehekülgede automaatse tükeldamise funktsiooni, kui kõik leheküljekujutised on õige paigutusega (nt neid ei skannitud tagurpidi).

Suvandeid Tuvasta lehekülje suund ja Eralda paarisleheküljed saab lubada ja keelata dialoogiboksi Suvandid vahekaardil Skanni/ava.

Märkus. Araabia-, heebrea- või jiidišikeelse tekstiga lehekülgede eraldamiseks vali kindlasti esmalt vastav tuvastuskeel ja alles siis suvand Eralda paarisleheküljed. See tagab, et leheküljed korraldatakse õigesti. Esialgse leheküljejärjestuse taastamiseks vali suvand Vaheta raamatu leheküljed. Lisateavet vt jaotisest "Mis on FineReaderi dokument?"

Kui dokument on keerulise struktuuriga, soovitame keelata automaatse analüüsimise ja kujutiste optilise tekstituvastuse ning teha need toimingud käsitsi.

Automaatse analüüsimise ja optilise tekstituvastuse keelamiseks toimi järgmiselt.

  1. Ava dialoogiboks Suvandid (Tööriistad> Suvandid…).
  2. Eemalda märge suvandilt Töötle lehekülgi nende lisamisel automaatselt vahekaardil Skanni/ava.
  3. Klõpsa nuppu OK.

Enam kui ühes keeles kirjutatud dokumentide tuvastamine

Järgmistes juhistes on näitena toodud dokument, mis sisaldab nii inglise- kui ka hiinakeelset teksti.

  1. Vali põhitööriistaribal suvand Veel keeli… ripploendist Dokumendi keeled. Vali käsk Määra keeled käsitsi dialoogiboksist Keelteredaktor ja vali keelte loendist hiina ja inglise keel.
  2. Skanni või ava kujutised.
  3. Kui programm ei suuda tuvastada kõiki alasid kujutisel toimi järgmiselt.
    • Määra alad käsitsi, kasutades ala redigeerimise tööriistu.
    • Määra alad, mis sisaldavad ainult üht keelt. Selleks vali need ja määra nende keel paanil Ala omadused.

Tähtis! Keele saab määrata ainult sama tüüpi aladele. Kui sa valisid erinevat tüüpi alad nagu nt Tekst ja Tabel, ei saa keelt määrata.

  1. Klõpsa põhitööriistaribal nuppu Tuvasta.

Kui tekstiaknas ei kuvata võõrmärke

Kui hieroglüüfkeeles kirjutatud teksti ei kuvata aknas Tekst õigesti, on võimalik, et oled valinud režiimi Lihttekst.

Režiimis Lihttekst kasutatava fondi muutmiseks toimi järgmiselt.

  1. Ava dialoogiboks Suvandid (Tööriistad> Suvandid…).
  2. Klõpsa vahekaarti Vaade.
  3. Vali font Arial Unicode MS ripploendist Lihtteksti font.
  4. Klõpsa nuppu OK.

Kui sellest polnud abi ja tekst aknas Tekst on ikkagi kuvatud vigaselt, vt jaotist "Kui mõned märgid on asendatud märgiga "?" või "□" Tekstiaknas."

Tuvastatud teksti suuna muutmine

ABBYY FineReader tuvastab teksti suuna automaatselt, kuid teksti suuna saab määrata ka käsitsi.

  1. Vali üks või mitu lõiku aknas Tekst.
  2. Klõpsa nuppu akna Tekst tööriistaribal.

Märkus. Saad kasutada ripploendit Hieroglüüfkirja suund aknas Kujutis, et määrata teksti suund enne tuvastamist. Üksikasjad leiad jaotisest Kui vertikaalset või pööratud teksti ei tuvastatud.

11/2/2018 5:31:18 PM


Please leave your feedback about this article