Ha a nyomtatott dokumentum nem szabványos betűtípusokat tartalmaz

A díszes betűtípusokat vagy speciális karaktereket (pl. matematikai jeleket) tartalmazó nyomtatott dokumentumok OCR-jének minőségét a Tanítás funkcióval javíthatja.

Megjegyzés: A tanítás mód használata más esetekben nem ajánlatos, mivel a felismerés minőségének nyeresége a tanításra fordított idővel és munkával összehasonlítva jelentéktelen lesz.

Tanítás módban egy felhasználói minta készül, mely a teljes szöveg OCR-jének végrehajtásakor használható.

A felhasználói minták használata

Dokumentum felismerése minta használatával:

  1. Nyissa meg a Beállítások párbeszédpanelt (Eszközök > Beállítások…), ezután kattintson a Értelmezés fülre.
  2. A Tanítás alatt jelölje be a Csak a felhasználói minta tanítása beállítást.

Megjegyzés: Ha bejelöli a A beépített és a felhasználói minták használata beállítást, akkor az ABBYY FineReader 12 a felhasználói mintákat és gyárilag előre beállított mintákat egyaránt használ az OCR-hez.

  1. Kattintson a Mintaszerkesztő… gombra.
  2. Válassza ki a kívánt mintát a Mintaszerkesztő párbeszédpanelen, ezt követően kattintson az OK gombra.
  3. Az ABBYY FineReader főablakában kattintson a Felismerés gombra.

Felhasználói minta létrehozása és betanítása

Egy felhasználói minta betanítása új karakterek és ikerbetűk felismerésére:

  1. Nyissa meg a Beállítások párbeszédpanelt (Eszközök > Beállítások…), ezután kattintson a Értelmezés fülre.
  2. A Tanítás alatt jelölje be a A beépített és a felhasználói minták használata vagy a Csak a felhasználói minta tanítása beállítást.
  3. Jelölje be a Értelmezés tanítással beállítást.
  4. Kattintson a Mintaszerkesztő… gombra.

Megjegyzés: Az ázsiai nyelvek minta betanítását nem támogatják.

  1. A Mintaszerkesztő párbeszédpanelen kattintson az Új… gombra
  2. Megnyílik a Minta létrehozása párbeszédpanel. Gépelje be a felhasználói minta nevét, és kattintson az OK gombra.
  3. Zárja be a Mintaszerkesztő és a Beállítások párbeszédpanelt, mindegyikben az OK gombra kattintva.
  4. A Kép ablak tetején elhelyezett eszköztáron kattintson a Felismerés gombra.

Ha az ABBYY FineReader most ismeretlen karakterrel találkozik, ez a karakter meg fog jelenni a Minta tanítása párbeszédpanelen.

  1. Tanítsa be a programot az új karakterek és az ikerbetűk felismerésére.

Az ikerbetű (ligatúra) két-három "összeragadt" karakter kombinációja (például fi, fl, ffi, stb.), és a programnak nehéz szétválasztania őket. Összetett karakterként kezelésükkel valójában jobb eredmény érhető el.

Megjegyzés: A szövegben félkövéren vagy dőlten nyomtatott szavak vagy az alsó/felső indexű szavak a Hatások alatti megfelelő beállítások bejelölésével megőrizhetők a felismert szövegben.

Az előzőleg betanított karakterhez való visszaugráshoz kattintson a Vissza gombra. A keret előző helyére ugrik, és a legutoljára betanított "karakterkép - billentyűzet-karakter" megfeleltetés eltávolításra kerül a mintából. A Vissza gombbal egy szó karakterei közt navigálhat, szavak között viszont nem lépkedhet.

Fontos!

  • Az ABBYY FineReadert csak a felismerési nyelv ábécéjében megtalálható karakterek felolvasására taníthatja be. A billentyűzetről nem beírható karakterek felismerésének betanításához használja két karakter kombinációját ezeknek a nem létező karaktereknek a jelölésére, vagy másolja ki a kívánt karaktert a Karakter beszúrása párbeszédpanelből (megnyitásához kattintson a   gombra).
  • Minden minta legfeljebb 1.000 új karaktert tartalmazhat. Kerülje el azonban túl sok ikerbetű létrehozását, ugyanis ennek hátrányos lehet a hatása az OCR minőségére.

A felhasználói minta kiválasztása

Az ABBYY FineReader minták használatával teszi lehetővé az OCR minőségének javítását.

  1. Az Eszközök menüben kattintson a Mintaszerkesztő… menüpontra.
  2. A Mintaszerkesztő párbeszédpanelen válassza ki a kívánt mintát a létező minták listájából, és kattintson az Aktívvá tesz elemre.

Néhány megjegyzendő fontos pont:

  1. Némely hasonló, ám mégis eltérő karakter megkülönböztetése helyett az ABBYY FineReader egy és ugyanazon karakterként ismeri fel őket. Például az egyenes (’), a bal (‘) és a jobb (’) idézőjelet egy karakterként tárolja a mintában (egyenes idézőjel). Ez azt jelenti, hogy a nyitó és a záró idézőjel sohasem kerül felhasználásra a felismert szövegben, még akkor sem, ha megpróbálkozik a betanításukkal.
  2. Néhány karakterkép esetében az ABBYY FineReader a szövegkörnyezet alapján választja ki a megfelelő billentyűzetkaraktert. Egy kis kör képét például O betűként ismeri föl, ha betűk vannak körülötte, és 0 számjegyként, ha számok vannak a szomszédságában.
  3. Egy minta csak olyan dokumentumokhoz használható fel, melyeknek ugyanolyan a betűtípusuk, a betűméretük és a felbontásuk, mint a minta létrehozásához felhasznált dokumentumé.
  4. Egy minta későbbi felhasználásához mentse fájlban a jelenlegi dokumentum beállításait. A részleteket lásd a "Mi a FineReader-dokumentum?" témakörben.
  5. Ha másik betűtípussal nyomtatott szövegeket kell felismertetnie, akkor győződjön meg róla, hogy az Eszközök > Beállítások… > Értelmezés párbeszédpanelen a Csak a beépített minták használata bejelölésével letiltotta-e a felhasználói mintát.

A felhasználói minta szerkesztése

Az újonnan létrehozott mintát szükség esetén az optikai szövegfelismerési folyamat indítása előtt módosíthatja. Egy nem megfelelően betanított minta ellentétes hatással lehet az optikai szövegfelismerés minőségére. A minta csak teljes karaktereket vagy ikerbetűket tartalmazhat. A metszett karaktereket és a pontatlan betűkapcsolatokat tartalmazó karaktereket el kell távolítani a mintából.

  1. Az Eszközök menüben kattintson a Mintaszerkesztő… parancsra.
  2. Megnyílik a Mintaszerkesztő párbeszédpanel. Válassza ki a kívánt mintát, majd kattintson a Szerkesztés… gombra.
  3. Válasszon egy karaktert a megnyíló Felhasználói minta párbeszédpanelen, és kattintson a Tulajdonságok… gombra.

A megnyíló párbeszédpanelen:

  • Írja be a Karakter mezőben lévő karakternek megfelelő betűt.
  • A Hatás mezőben adja meg a kívánt betűhatást (félkövér, dőlt, felső index és alsó index).

Nem megfelelően betanított karakter törléséhez a Felhasználói minta párbeszédpanelen kattintson a Törlés gombra.

14.01.2020 17:26:19

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.