Összetett írásrendszerű nyelvek használata

Az ABBYY FineReaderrel arab, héber, jiddis, thai, kínai, japán és koreai nyelvű dokumentumokat is felismerhet. Kínai, japán vagy koreai nyelvű dokumentumok, illetve ezek és az európai nyelvek kombinációjával készült dokumentumokkal való munka során néhány további szempontot kell figyelembe venni.

Ajánlott betűtípusok

Az arab, héber, jiddis, thai, kínai, japán és korai nyelvű szöveg felismeréséhez további betűtípusok telepítésére lehet szükség. Az alábbi táblázatban áttekintheti az ilyen nyelvű szövegekhez ajánlott betűtípusokat.

OCR-nyelvek Ajánlott betűtípus
Arab Arial™ Unicode™ MS
Héber Arial™ Unicode™ MS
Jiddis Arial™ Unicode™ MS
Thai

Arial™ Unicode™ MS

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Kínai (egyszerűsített)

kínai (hagyományos)

japán, koreai

koreai (hangul)

Arial™ Unicode™ MS

SimSun-betűtípusok, például:

Example SimSun (Founder Extended),

SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(for-ISO10646)

STSong

Az alábbi részekben tanácsokat kaphat a felismerés pontosságának javításához.

Az automatikus képfeldolgozás letiltása

Alapértelmezésként az OCR-projekthez hozzáadott bármilyen oldal automatikusan felismerésre kerül.

Ha viszont a dokumentum európai nyelvvel kombinált japán, kínai vagy koreai nyelvű szöveget tartalmaz, akkor az oldaltájolás automatikus észlelésének letiltását javasoljuk, és a dupla oldalak csak abban az esetben történő felosztását, ha az összes oldalképnek megfelelő a tájolása (pl. nem fejjel lefelé kerültek beolvasásra).

A Oldaltájolás javítása és a Szemközti oldalak felosztása beállítás a  Képfeldolgozás fülön a Beállítások párbeszédpanelen található (kattintson a Eszközök > Beállítások... ennek a párbeszédpanelnek a megnyitásához).

Arab, héber vagy jiddis nyelvű szemközti oldalak felosztása esetén ügyeljen arra, hogy előbb válassza ki a megfelelő felismerési nyelvet, és csak ezután jelölje be a Szemközti oldalak felosztása beállítást. Az eredeti oldalszámozás a Könyvoldalak felcserélése beállítás bejelölésével is visszaállítható. Lásd még: OCR-projektek.

Ha bonyolult szerkezetű a dokumentum, akkor javasoljuk a képek automatikus elemzését és OCR-jét, és ezeknek a műveleteknek a kézi végrehajtását.

Az újonnan hozzáadott képek automatikus elemzését és OCR-jét a Képfeldolgozás fülön a Beállítások párbeszédpanelen kapcsolhatja ki (kattintson a Eszközök > Beállítások... ennek a párbeszédpanelnek a megnyitásához) megadható beállításkészlet.

  1. Kattintson a Eszközök > Beállítások... gombraa párbeszédpanel Beállítások megnyitásához.
  2. A Képfeldolgozás fülön törölje a Az oldalképek automatikus feldolgozása, amint hozzáadásra kerülnek az OCR-szerkesztőhöz beállítást.
  3. Kattintson az OK gombra.

Többnyelvű dokumentumok felismerése

Az alábbi utasításokban angol és kínai nyelvű szöveget egyaránt tartalmazó dokumentum szerepel példaként. Más nyelveket tartalmazó dokumentumok hasonló módon ismerhetők fel.

  1. A fő eszköztáron válassza ki a Több nyelv... elemet a nyelvlistából. A Nyelvszerkesztő párbeszédpanelen jelölje be Adja meg kézzel az OCR-nyelveket beállítást, válassza ki a kínai és az angol nyelvet a nyelvlistából
  2. Olvassa be az oldalakat, vagy nyissa meg a képeket.
  3. Ha nem sikerül az összes blokkot felismernie a programnak egy képen:
    • Adja meg kézzel a blokkokat a blokkszerkesztő eszközökkel.
    • Adjon meg minden olyan blokkot, mely csak egynyelvű, és a Blokk tulajdonságai panelen válassza szükség szerint az angol vagy a kínai nyelvet.
      Csak azonos típusú blokkok nyelve adható meg. Ha különböző típusú blokkokat jelölt ki, például szöveg- és táblázatblokkot, akkor nem tud nyelvet megadni.
    • Szükség esetén válassza ki a szövegirányt a Tájolás legördülő listából (a részleteket lásd a Ha nem ismerhető fel a függőleges vagy az invertált szöveg témakörben).
    • Japán, kínai és koreai nyelvű szövegek esetén a program biztosítja a szövegirány választást a A kínai, japán és koreai nyelvű szöveg iránya legördülő listából (a részleteket lásd a Blokktulajdonságok szerkesztése témakörben).

Ha nem jelennek meg a nem európai karakterek a Szöveg ablaktáblában

Ha nem megfelelően jelenik meg a kínai, japán vagy koreai nyelvű szöveg aSzöveg ablaktáblában, akkor feltehetőleg az Egyszerű szöveg módot választotta.

Az Egyszerű szöveg módban használt betűtípus átváltása:

  1. Kattintson a Eszközök > Beállítások... parancsraa a menüben a Beállítások párbeszédpanel megnyitásához.
  2. Kattintson a Blokkok és\nszövegek fülre.
  3. Válassza ki az Arial Unicode MS elemet a Az egyszerű szöveg megjelenítéséhez használt betűtípus legördülő listából.
  4. Kattintson az OK gombra.

Ha ez nem segített, és a Szöveg ablakban látható szöveg még mindig hibásan jelenik meg, akkor lásd A használt betűtípus nem megfelelő, avagy némely karakter helyett "?" vagy "□" látható témakört.

A felismert szöveg irányának megváltoztatása

Az ABBYY FineReader automatikusan ismeri fel a szövegirányt, viszont Ön is megadhatja kézzel.

  1. Aktiválja a Szöveg ablaktáblát.
  2. Jelöljön ki egy vagy több bekezdést.
  3. Kattintson a gombra a Szöveg ablaktábla eszköztárán.

Az OCR előtt a Kép ablakban található A kínai, japán és koreai nyelvű szöveg iránya legördülő lista használatával adhatja meg a szövegirányt. Lásd még: A blokktulajdonságok módosítása.

02.11.2018 16:19:24


Please leave your feedback about this article