Az OCR előtt figyelembe veendő dokumentumjellemzők

A képek minősége jelentős hatással van a felismerés minőségére. Ebben a részben magyarázatot kaphat arra, hogy milyen tényezőket kell figyelembe vennie a képek felismerése előtt:

A dokumentum nyelvei

Az ABBYY FineReader egy- és többnyelvű dokumentumokat (pl. két vagy több nyelven írottakat) egyaránt felismer. A többnyelvű dokumentumok számára több felismerési nyelvet kell kiválasztania.

A dokumentum OCR-nyelvének megadásához a fő eszköztáron a Dokumentum nyelve legördülő listából vagy a Feladat ablakban válasszon egyet az alábbiak közül:

  • Automatikus választás

Az ABBYY FineReader automatikusan választja ki a megfelelő nyelveket a nyelvek felhasználói listájából. Ezt a listát a következők szerint módosíthatja:

  1. Válassza a Több nyelv… parancsot.
  2. A Nyelvszerkesztő párbeszédpanelen jelölje be A dokumentum nyelveinek automatikus kiválasztása az alábbi listából beállítást.
  3. Kattintson a Megadás… gombra.
  4. Adja meg a kívánt nyelveket a Nyelvek párbeszédpanelen.
  • Egy nyelv vagy nyelvkombináció

Válasszon egy nyelvet vagy egy nyelvkombinációt. A nyelvek listája a mostanában használt felismerési nyelveket tartalmazza, valamint az angolt, a németet és a franciát.

  • Több nyelv…

Ezt a beállítást akkor jelölje be, ha a szükséges nyelv nem látható a listában.

A Nyelvszerkesztő párbeszédpanelen jelölje be A nyelvek kézi megadása beállítást, ezután a megfelelő jelölőnégyzetek bejelölésével válassza ki a kívánt nyelvet vagy nyelveket. Ha gyakran használ egy adott nyelvkombinációt, akkor új csoportot hozhat létre a számukra.

Ha egy nyelv nem szerepel a listában, akkor vagy:

  1. Az ABBYY FineReader nem támogatja ezt a nyelvet.

A támogatott nyelvek teljes listáját lásd a "Támogatott felismerési nyelvek" témakörben.

  1. Az Ön szoftverpéldánya nem támogatja a nyelvet.

Az Ön példányában elérhető teljes nyelvlista a Licencek párbeszédpanelen (Súgó > Névjegy… >Licencadatok) található.

A beépített nyelvek és nyelvcsoportok használatán kívül létrehozhatja sajátjait. A részleteket lásd a "Ha nem sikerül néhány karaktert felismernie a programnak" témakörben.

A nyomtatás típusa

A dokumentumok különféle eszközökkel nyomtathatók, például írógépekkel vagy faxkészülékekkel. Az OCR minősége a Beállítások párbeszédpanelen a megfelelő Dokumentum típusa bejelölésével javítható.

A legtöbb dokumentum esetében a program automatikusan ismeri fel a nyomtatási típust. Az automatikus nyomtatási típus felismeréséhez a Beállítások párbeszédpanelen (Eszközök > Beállítások…) a Dokumentum típusa alatt be kell jelölni az Automatikus beállítást. A dokumentum teljes színes vagy fekete-fehér módban dolgozható fel.

Választhatja azt is, hogy szükség esetén kézzel adja meg a nyomtatási típust.

Példa írógéppel írott szövegre. Az összes betű egyenlő szélességű (hasonlítsa össze például a "w" és a "t" betűt). Az ilyen típusú szövegekhez válassza az Írógép típust.
Példa faxkészülékkel előállított szövegre. Ahogy a példából látható, a zajon és a torzításon kívül néhány helyen nem tiszták a betűk. Az ilyen típusú szövegekhez válassza a Fax típust.

Tipp: A gépelt szövegek vagy faxok felismerése után ügyeljen arra, hogy a hagyományos nyomtatott dokumentumok feldolgozása előtt megadja az Automatikus beállítást.

A nyomtatás minősége

A "zajos" (pl. véletlenszerű fekete pontok vagy foltok), gyenge minőségű dokumentumok, elmosódott és egyenlőtlen betűk vagy ferde sorok és eltolódott táblázatszegélyek konkrét beolvasási beállításokat követelhetnek meg.

Fax Újság

A gyenge minőségű dokumentumokat a legjobb szürkeárnyalatos módban beolvasni. Szürkeárnyalatos módban való beolvasáskor a program automatikusan választja ki a fényerő optimális értékét.

A szürkeárnyalatos képolvasási mód több információt őriz meg a beolvasott szövegben lévő betűkről, amivel közepes és gyenge minőségű dokumentumok felismerésekor jobb OCR-eredmény érhető el. Néhány hibát a Képszerkesztőben elérhető képszerkesztő eszközök használatával kézzel is kijavíthat. A részleteket lásd a "Képelőfeldolgozás" témakörben.

Színmód

Ha nem kell megőriznie egy teljes színes dokumentum eredeti színeit, akkor fekete-fehér módban dolgozhatja fel a dokumentumot. Ez nagymértékben csökkenti az eredményül kapott ABBYY FineReader-dokumentum méretét, és felgyorsítja az OCR-folyamatot. Csekély kontrasztú képek fekete-fehérben való feldolgozása azonban gyenge OCR-minőséget eredményezhet. Fényképek, magazinoldalak, valamint kínai, japán és koreai betűk fekete-fehér feldolgozását sem ajánljuk.

Megjegyzés: A színes és fekete-fehér dokumentumok felismerését a Beállítások párbeszédpanel Értelmezés fülén található Gyors értelmezés beállítás bejelölésével is felgyorsíthatja. A felismerési módokról bővebben lásd az "OCR-beállítások" témakört.

Egy színmód kiválasztása:

  • Használja a Szín mód legördülő listát a Feladat párbeszédpanelen, vagy
  • Jelölje be az egyik beállítást a Beállítások párbeszédpanel (Eszközök > Beállítások…) Dokumentum fülén a Szín mód alatt.

Fontos! A dokumentum fekete-fehérré átalakítása után a színek nem állíthatók vissza. Színes dokumentumhoz való hozzájutáshoz nyissa meg a színes képeket tartalmazó fájlt, vagy olvassa be színes módban a papírdokumentumot.

1/14/2020 5:26:19 PM


Please leave your feedback about this article