Ha a nyomtatott dokumentum nem szabványos betűtípusokat tartalmaz

Ha a felismerni kívánt dokumentum díszes betűtípusokat vagy speciális karaktereket (pl. matematikai jeleket) tartalmaz, akkor a felismerés pontosságának javításához a betanítás mód használatát ajánljuk.

A betanítás mód használata más esetekben nem ajánlatos, mivel a felismerés minőségének nyeresége a betanításra fordított idővel és munkával összehasonlítva jelentéktelen lesz.

Tanítás módban egy felhasználói minta készül, mely a teljes szöveg OCR-jének végrehajtásakor használható fel.

A felhasználói minták használata

Dokumentum felismerése felhasználói minta használatával:

  1. Kattintson Eszközök > Beállítások... a Beállítások párbeszédpanel megnyitásához, majd kattintson a OCR fülre.
  2. Válassza a Felhasználói minták használata beállítást.
    Ha a Beépített minták használata is beállítás alatt bejelölte a Felhasználói minták használata beállítást, akkor az ABBYY FineReader a saját beépített mintáit fogja felhasználni a létrehozott felhasználói mintákon kívül.
  3. Kattintson a Mintaszerkesztő... gombra.
  4. A Mintaszerkesztő párbeszédpanelen jelöljön ki egy mintát, majd kattintson az OK gombra.
  5. Kattintson a gombra az OCR-szerkesztő ablakának tetején található fő eszköztáron.

Felhasználói minta létrehozása és betanítása

Egy felhasználói minta betanítása új karakterek és ikerbetűk felismerésére:

  1. Kattintson Eszközök > Beállítások... a Beállítások párbeszédpanel megnyitásához, majd kattintson a OCR fülre.
  2. Válassza a Az új karakterek és ikerbetűk felismerése betanítással beállítást.
    Ha a Beépített minták használata is beállítás alatt bejelölte a Az új karakterek és ikerbetűk felismerése betanítással beállítást, akkor az ABBYY FineReader a saját beépített mintáit fogja felhasználni a létrehozott felhasználói mintákon kívül.
  3. Kattintson a Mintaszerkesztő... gombra.
    Ázsiai nyelvek esetén a program nem támogatja a minta betanítást.
  4. A Mintaszerkesztő párbeszédpanelen kattintson a Új... gombra.
  5. A Minta létrehozása párbeszédpanelen adja meg az új minta nevét, majd kattintson a OK.
  6. Kattintson OK a Mintaszerkesztő párbeszédpanelen, majd kattintson az OK gombra a Beállítások párbeszédpanelen.
  7. Kattintson a gombra a Kép ablaktábla tetején lévő eszköztáron.
    Ha a program olyan karakterrel találkozik, melyet nem ismer fel, akkor megnyílik a Minta tanítása párbeszédpanel, melyben megjelenik ez a karakter.
  8. Tanítsa be a programot az új karakterek és ikerbetűk felismerésére.
    Az ikerbetű (ligatúra) két-három "összeragadt" karakter kombinációja (például fi, fl, ffi, stb.), melyeket nehéz szétválasztania a programnak. Összetett karakterként kezelésükkel valójában jobb eredményt érhet el.
    A szövegben félkövéren vagy dőlten nyomtatott szavak vagy az alsó/felső indexű szavak a Hatások alatti megfelelő beállítások bejelölésével megőrizhetők a felismert szövegben.
    Az előzőleg betanított karakterhez való visszaugráshoz kattintson a Vissza gombra. A keret előző helyére ugrik, és a legutoljára betanított "karakterkép - billentyűzet-karakter" megfeleltetés eltávolításra kerül a mintából. A Vissza gombbal egy szó karakterei közt navigálhat, szavak között viszont nem lépkedhet.

Fontos!

  • Az ABBYY FineReader PDF alkalmazást csak az OCR-nyelv ábécéjében megtalálható karakterek olvasására taníthatja be. A billentyűzetről nem beírható karakterek felismerésének betanításához használja két karakter kombinációját ezeknek a nem létező karaktereknek a jelölésére, vagy másolja ki a kívánt karaktert a Karakter beszúrása párbeszédpanelből (kattintson a  ennek a párbeszédpanelnek a megnyitásához).
  • Minden minta legfeljebb 1.000 új karaktert tartalmazhat. Kerülje azonban túl sok ikerbetű létrehozását, ugyanis ennek hátrányos lehet a hatása az OCR minőségére.

A felhasználói minta kiválasztása

Az ABBYY FineReader minták használatával teszi lehetővé az OCR minőségének javítását.

  1. Kattintson Eszközök > Mintaszerkesztő....
  2. A Mintaszerkesztő párbeszédpanelen jelölje ki az egyik mintát a listában, majd kattintson az Aktívvá tesz gombra.

Néhány megjegyzendő fontos pont:

  1. A program néha nem tesz különbséget a nagyon hasonló, ám eltérő karakterek között, egy és ugyanazon karakterként ismeri fel őket. Például az egyenes (’), a bal (‘) és a jobb (’) idézőjelet egyetlen karakterként tárolja a mintában (egyenes idézőjel). Ez azt jelenti, hogy a nyitó és a záró idézőjel sohasem kerül felhasználásra a felismert szövegben, még akkor sem, ha megpróbálkozik a betanításukkal.
  2. Néhány karakterkép esetében az ABBYY FineReader PDF a szövegkörnyezet alapján választja ki a megfelelő billentyűzetkaraktert. Egy kis kör képét például O betűként ismeri föl, ha betűk vannak körülötte, és 0 számjegyként, ha számok vannak a szomszédságában.
  3. Egy minta csak olyan dokumentumokhoz használható fel, melyeknek ugyanolyan a betűtípusuk, a betűméretük és a felbontásuk, mint a minta létrehozásához felhasznált dokumentumé.
  4. A mintát fájlban mentheti, és más OCR-projektekben használhatja fel. Lásd még: OCR-projektek.
  5. Másik betűtípussal nyomtatott szövegek felismerése esetén győződjön meg róla, hogy letiltotta-e a felhasználói mintát. Ehhez kattintson azEszközök > Beállítások... a Beállítások párbeszédpanel megnyitásához, kattintson a OCR fülre, és jelölje be a Beépített minták használata beállítást.

A felhasználói minta szerkesztése

Az újonnan létrehozott mintát szükség esetén az OCR-folyamat indítása előtt módosíthatja. Egy nem megfelelően betanított minta ellentétes hatással lehet az OCR minőségére. A minta csak teljes karaktereket vagy ikerbetűket tartalmazhat. A metszett karaktereket és a pontatlan betűkapcsolatokat tartalmazó karaktereket el kell távolítani a mintából.

  1. Kattintson Eszközök > Mintaszerkesztő....
  2. A Mintaszerkesztő párbeszédpanelen válassza ki a szerkeszteni kívánt mintát, majd kattintson a Szerkesztés... gombra.
  3. A Felhasználói minta párbeszédpanelen jelöljön ki egy karaktert, majd kattintson a Tulajdonságok... gombra.

A megnyíló párbeszédpanelen:

  • A Karakter mezőben írja be a karakternek megfelelő betűt.
  • A Hatás mezőben adja meg a kívánt betűhatást (félkövér, dőlt, felső index vagy alsó index).

Nem megfelelően betanított karakter törléséhez kattintson a Törlés gombra a Felhasználói minta párbeszédpanelen.

6/12/2024 2:30:21 PM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.