Az OCR előtt figyelembe veendő dokumentumjellemzők

A képek minősége jelentős hatással van a felismerés minőségére. Ebben a részben magyarázatot kaphat arra, hogy milyen tényezőket kell figyelembe vennie a képek felismerése előtt:

A dokumentum nyelvei

Az ABBYY FineReader egy- és többnyelvű dokumentumokat (pl. két vagy több nyelven írottakat) egyaránt felismer. A többnyelvű dokumentumok számára több felismerési nyelvet kell kiválasztania.

A dokumentum OCR-nyelvének megadásához a fő eszköztáron a Dokumentum nyelve legördülő listából vagy a Feladat ablakban válasszon egyet az alábbiak közül:

  • Automatikus választás

Az ABBYY FineReader automatikusan választja ki a megfelelő nyelveket a nyelvek felhasználói listájából. Ezt a listát a következők szerint módosíthatja:

  1. Válassza a Több nyelv… parancsot.
  2. A Nyelvszerkesztő párbeszédpanelen jelölje be A dokumentum nyelveinek automatikus kiválasztása az alábbi listából beállítást.
  3. Kattintson a Megadás… gombra.
  4. Adja meg a kívánt nyelveket a Nyelvek párbeszédpanelen.
  • Egy nyelv vagy nyelvkombináció

Válasszon egy nyelvet vagy egy nyelvkombinációt. A nyelvek listája a mostanában használt felismerési nyelveket tartalmazza, valamint az angolt, a németet és a franciát.

  • Több nyelv…

Ezt a beállítást akkor jelölje be, ha a szükséges nyelv nem látható a listában.

A Nyelvszerkesztő párbeszédpanelen jelölje be A nyelvek kézi megadása beállítást, ezután a megfelelő jelölőnégyzetek bejelölésével válassza ki a kívánt nyelvet vagy nyelveket. Ha gyakran használ egy adott nyelvkombinációt, akkor új csoportot hozhat létre a számukra.

Ha egy nyelv nem szerepel a listában, akkor vagy:

  1. Az ABBYY FineReader nem támogatja ezt a nyelvet.

A támogatott nyelvek teljes listáját lásd a "Támogatott felismerési nyelvek" témakörben.

  1. Az Ön szoftverpéldánya nem támogatja a nyelvet.

Az Ön példányában elérhető teljes nyelvlista a Licencek párbeszédpanelen (Súgó > Névjegy… >Licencadatok) található.

A beépített nyelvek és nyelvcsoportok használatán kívül létrehozhatja sajátjait. A részleteket lásd a "Ha nem sikerül néhány karaktert felismernie a programnak" témakörben.

A nyomtatás típusa

A dokumentumok különféle eszközökkel nyomtathatók, például írógépekkel vagy faxkészülékekkel. Az OCR minősége a Beállítások párbeszédpanelen a megfelelő Dokumentum típusa bejelölésével javítható.

A legtöbb dokumentum esetében a program automatikusan ismeri fel a nyomtatási típust. Az automatikus nyomtatási típus felismeréséhez a Beállítások párbeszédpanelen (Eszközök > Beállítások…) a Dokumentum típusa alatt be kell jelölni az Automatikus beállítást. A dokumentum teljes színes vagy fekete-fehér módban dolgozható fel.

Választhatja azt is, hogy szükség esetén kézzel adja meg a nyomtatási típust.

Példa írógéppel írott szövegre. Az összes betű egyenlő szélességű (hasonlítsa össze például a "w" és a "t" betűt). Az ilyen típusú szövegekhez válassza az Írógép típust.
Példa faxkészülékkel előállított szövegre. Ahogy a példából látható, a zajon és a torzításon kívül néhány helyen nem tiszták a betűk. Az ilyen típusú szövegekhez válassza a Fax típust.

Tipp: A gépelt szövegek vagy faxok felismerése után ügyeljen arra, hogy a hagyományos nyomtatott dokumentumok feldolgozása előtt megadja az Automatikus beállítást.

A nyomtatás minősége

A "zajos" (pl. véletlenszerű fekete pontok vagy foltok), gyenge minőségű dokumentumok, elmosódott és egyenlőtlen betűk vagy ferde sorok és eltolódott táblázatszegélyek konkrét beolvasási beállításokat követelhetnek meg.

Fax Újság

A gyenge minőségű dokumentumokat a legjobb szürkeárnyalatos módban beolvasni. Szürkeárnyalatos módban való beolvasáskor a program automatikusan választja ki a fényerő optimális értékét.

A szürkeárnyalatos képolvasási mód több információt őriz meg a beolvasott szövegben lévő betűkről, amivel közepes és gyenge minőségű dokumentumok felismerésekor jobb OCR-eredmény érhető el. Néhány hibát a Képszerkesztőben elérhető képszerkesztő eszközök használatával kézzel is kijavíthat. A részleteket lásd a "Képelőfeldolgozás" témakörben.

Színmód

Ha nem kell megőriznie egy teljes színes dokumentum eredeti színeit, akkor fekete-fehér módban dolgozhatja fel a dokumentumot. Ez nagymértékben csökkenti az eredményül kapott ABBYY FineReader-dokumentum méretét, és felgyorsítja az OCR-folyamatot. Csekély kontrasztú képek fekete-fehérben való feldolgozása azonban gyenge OCR-minőséget eredményezhet. Fényképek, magazinoldalak, valamint kínai, japán és koreai betűk fekete-fehér feldolgozását sem ajánljuk.

Megjegyzés: A színes és fekete-fehér dokumentumok felismerését a Beállítások párbeszédpanel Értelmezés fülén található Gyors értelmezés beállítás bejelölésével is felgyorsíthatja. A felismerési módokról bővebben lásd az "OCR-beállítások" témakört.

Egy színmód kiválasztása:

  • Használja a Szín mód legördülő listát a Feladat párbeszédpanelen, vagy
  • Jelölje be az egyik beállítást a Beállítások párbeszédpanel (Eszközök > Beállítások…) Dokumentum fülén a Szín mód alatt.

Fontos! A dokumentum fekete-fehérré átalakítása után a színek nem állíthatók vissza. Színes dokumentumhoz való hozzájutáshoz nyissa meg a színes képeket tartalmazó fájlt, vagy olvassa be színes módban a papírdokumentumot.

14.01.2020 17:26:19

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.