Ha a nyomtatott dokumentum nem szabványos betűtípusokat tartalmaz

A díszes betűtípusokat vagy speciális karaktereket (pl. matematikai jeleket) tartalmazó nyomtatott dokumentumok OCR-jének minőségét a Tanítás funkcióval javíthatja.

Megjegyzés: A tanítás mód használata más esetekben nem ajánlatos, mivel a felismerés minőségének nyeresége a tanításra fordított idővel és munkával összehasonlítva jelentéktelen lesz.

Tanítás módban egy felhasználói minta készül, mely a teljes szöveg OCR-jének végrehajtásakor használható.

A felhasználói minták használata

Dokumentum felismerése minta használatával:

  1. Nyissa meg a Beállítások párbeszédpanelt (Eszközök > Beállítások…), ezután kattintson a Értelmezés fülre.
  2. A Tanítás alatt jelölje be a Csak a felhasználói minta tanítása beállítást.

Megjegyzés: Ha bejelöli a A beépített és a felhasználói minták használata beállítást, akkor az ABBYY FineReader 12 a felhasználói mintákat és gyárilag előre beállított mintákat egyaránt használ az OCR-hez.

  1. Kattintson a Mintaszerkesztő… gombra.
  2. Válassza ki a kívánt mintát a Mintaszerkesztő párbeszédpanelen, ezt követően kattintson az OK gombra.
  3. Az ABBYY FineReader főablakában kattintson a Felismerés gombra.

Felhasználói minta létrehozása és betanítása

Egy felhasználói minta betanítása új karakterek és ikerbetűk felismerésére:

  1. Nyissa meg a Beállítások párbeszédpanelt (Eszközök > Beállítások…), ezután kattintson a Értelmezés fülre.
  2. A Tanítás alatt jelölje be a A beépített és a felhasználói minták használata vagy a Csak a felhasználói minta tanítása beállítást.
  3. Jelölje be a Értelmezés tanítással beállítást.
  4. Kattintson a Mintaszerkesztő… gombra.

Megjegyzés: Az ázsiai nyelvek minta betanítását nem támogatják.

  1. A Mintaszerkesztő párbeszédpanelen kattintson az Új… gombra
  2. Megnyílik a Minta létrehozása párbeszédpanel. Gépelje be a felhasználói minta nevét, és kattintson az OK gombra.
  3. Zárja be a Mintaszerkesztő és a Beállítások párbeszédpanelt, mindegyikben az OK gombra kattintva.
  4. A Kép ablak tetején elhelyezett eszköztáron kattintson a Felismerés gombra.

Ha az ABBYY FineReader most ismeretlen karakterrel találkozik, ez a karakter meg fog jelenni a Minta tanítása párbeszédpanelen.

  1. Tanítsa be a programot az új karakterek és az ikerbetűk felismerésére.

Az ikerbetű (ligatúra) két-három "összeragadt" karakter kombinációja (például fi, fl, ffi, stb.), és a programnak nehéz szétválasztania őket. Összetett karakterként kezelésükkel valójában jobb eredmény érhető el.

Megjegyzés: A szövegben félkövéren vagy dőlten nyomtatott szavak vagy az alsó/felső indexű szavak a Hatások alatti megfelelő beállítások bejelölésével megőrizhetők a felismert szövegben.

Az előzőleg betanított karakterhez való visszaugráshoz kattintson a Vissza gombra. A keret előző helyére ugrik, és a legutoljára betanított "karakterkép - billentyűzet-karakter" megfeleltetés eltávolításra kerül a mintából. A Vissza gombbal egy szó karakterei közt navigálhat, szavak között viszont nem lépkedhet.

Fontos!

  • Az ABBYY FineReadert csak a felismerési nyelv ábécéjében megtalálható karakterek felolvasására taníthatja be. A billentyűzetről nem beírható karakterek felismerésének betanításához használja két karakter kombinációját ezeknek a nem létező karaktereknek a jelölésére, vagy másolja ki a kívánt karaktert a Karakter beszúrása párbeszédpanelből (megnyitásához kattintson a   gombra).
  • Minden minta legfeljebb 1.000 új karaktert tartalmazhat. Kerülje el azonban túl sok ikerbetű létrehozását, ugyanis ennek hátrányos lehet a hatása az OCR minőségére.

A felhasználói minta kiválasztása

Az ABBYY FineReader minták használatával teszi lehetővé az OCR minőségének javítását.

  1. Az Eszközök menüben kattintson a Mintaszerkesztő… menüpontra.
  2. A Mintaszerkesztő párbeszédpanelen válassza ki a kívánt mintát a létező minták listájából, és kattintson az Aktívvá tesz elemre.

Néhány megjegyzendő fontos pont:

  1. Némely hasonló, ám mégis eltérő karakter megkülönböztetése helyett az ABBYY FineReader egy és ugyanazon karakterként ismeri fel őket. Például az egyenes (’), a bal (‘) és a jobb (’) idézőjelet egy karakterként tárolja a mintában (egyenes idézőjel). Ez azt jelenti, hogy a nyitó és a záró idézőjel sohasem kerül felhasználásra a felismert szövegben, még akkor sem, ha megpróbálkozik a betanításukkal.
  2. Néhány karakterkép esetében az ABBYY FineReader a szövegkörnyezet alapján választja ki a megfelelő billentyűzetkaraktert. Egy kis kör képét például O betűként ismeri föl, ha betűk vannak körülötte, és 0 számjegyként, ha számok vannak a szomszédságában.
  3. Egy minta csak olyan dokumentumokhoz használható fel, melyeknek ugyanolyan a betűtípusuk, a betűméretük és a felbontásuk, mint a minta létrehozásához felhasznált dokumentumé.
  4. Egy minta későbbi felhasználásához mentse fájlban a jelenlegi dokumentum beállításait. A részleteket lásd a "Mi a FineReader-dokumentum?" témakörben.
  5. Ha másik betűtípussal nyomtatott szövegeket kell felismertetnie, akkor győződjön meg róla, hogy az Eszközök > Beállítások… > Értelmezés párbeszédpanelen a Csak a beépített minták használata bejelölésével letiltotta-e a felhasználói mintát.

A felhasználói minta szerkesztése

Az újonnan létrehozott mintát szükség esetén az optikai szövegfelismerési folyamat indítása előtt módosíthatja. Egy nem megfelelően betanított minta ellentétes hatással lehet az optikai szövegfelismerés minőségére. A minta csak teljes karaktereket vagy ikerbetűket tartalmazhat. A metszett karaktereket és a pontatlan betűkapcsolatokat tartalmazó karaktereket el kell távolítani a mintából.

  1. Az Eszközök menüben kattintson a Mintaszerkesztő… parancsra.
  2. Megnyílik a Mintaszerkesztő párbeszédpanel. Válassza ki a kívánt mintát, majd kattintson a Szerkesztés… gombra.
  3. Válasszon egy karaktert a megnyíló Felhasználói minta párbeszédpanelen, és kattintson a Tulajdonságok… gombra.

A megnyíló párbeszédpanelen:

  • Írja be a Karakter mezőben lévő karakternek megfelelő betűt.
  • A Hatás mezőben adja meg a kívánt betűhatást (félkövér, dőlt, felső index és alsó index).

Nem megfelelően betanított karakter törléséhez a Felhasználói minta párbeszédpanelen kattintson a Törlés gombra.

1/14/2020 5:26:19 PM


Please leave your feedback about this article