Dokumendi funktsioonid, mida kaaluda enne OCR-i

Kujutiste kvaliteedil on märkimisväärne mõju OCR-i kvaliteedile. See osa selgitab, milliste teguritega peaksid arvestama enne kujutiste tuvastamist.

OCR-keeled

ABBYY FineReader suudab tuvastada nii ühe- kui mitmekeelseid dokumente (kirjutatud nt kahes või enamas keeles). Mitmekeelsete dokumentide puhul pead valima mitu OCR-i keelt.

OCR-i keelte valimiseks klõpsa Suvandid > Keeled ja vali üks järgnevatest suvanditest:

  • Vali automaatselt OCR-keeled järgmisest loendist
    ABBYY FineReader valib automaatselt kasutaja määratud keelte loendist sobivad keeled. Keelte loendi muutmiseks:
    1. Veendu, et Vali automaatselt OCR-keeled järgmisest loendist suvand on valitud.
    2. Klõpsa Määra... nuppu.
    3. Kahekõne väljal Keeled vali soovitud keeled ja klõpsa OK.
    4. Kahekõne väljal Suvandid klõpsa OK.
  • Määra OCRi keeled käsitsi
    Vali see suvand, kui sulle vajalik keel loendist puudub.

Allolevas kahekõne aknas määratle üks või rohkem keelt. Kui kasutad teatud keelte kombinatsiooni sageli, saad luua uue rühma nende keelte jaoks.

Kui keelt pole loendis, siis see kas:

  1. Ei toeta ABBYY FineReader või
    Toega keelte täielikku loendit vaata Toega OCR-i keeled.
  2. Ei toeta sinu toote versioon.
    Sinu toote versioonis saadaolevate keelte täieliku loendi võib leida Litsentside kahekõne aknas (klõpsa Spikker > Teave > Litsentsi teave selle kahekõne akna avamiseks).

Lisaks sisseehitatud keelte ja keelerühmadele kasutamisele saad luua omi keeli ja rühmi. Vaata ka: Kui programm ei suuda tuvastada teatud märke.

Trükkimise tüüp

Dokumente saab trükkida erinevate seadmete abil, näiteks trükimasinad ja faksid. OCR-i kvaliteet võib erineda sõltuvalt sellest, kuidas dokument trükiti. Saad OCR-i kvaliteeti parandada, valides trükkimise õige tüübi Suvandid kahekõne aknas.

Enamike dokumentide korral tuvastab programm nende trükkimise tüübi automaatselt. Trükkimise tüübi automaatseks tuvastamiseks peab olema valitud Automaatne suvand, mis asub Dokumendi tüüp suvandite rühmas Suvandid kahekõne aknas (klõpsa Tööriistad > Suvandid... > Optiline\ntekstituvastus, et neile suvanditele ligi pääseda). Dokumente saad töödelda kas täisvärvides või must-valges režiimis.

Vajadusel saad valida ka trükkimise tüübi käsitsi valimise.

Trükimasinal trükitud teksti näidis. Kõik tähed on võrdse laiusega (võrdle näiteks tähti "w" ja "t"). Seda tüüpi tekstide jaoks vali Kirjutusmasin.
Faksi poolt loodud teksti näide. Nagu näitest näha võid, ei ole tähed mõnes kohas selged. Lisaks on seal ka müra ja moonutusi. Seda tüüpi tekstide jaoks vali Faks.

Pärast kirjutusmasinal trükitud tekstide või fakside tuvastamist vali kindlasti Automaatne enne tavapäraste trükitud dokumentide töötlemist.

Trükkimise kvaliteet

Kehva kvaliteediga dokumendid, millel on "müra" (nt juhuslikud mustad täpid või punktid), udused või ebaühtlased tähed, kaldus read ja tabeli nihkes eraldusjooned võivad vajada skannimise eriseadeid.

Faks Ajaleht

Kehva kvaliteediga dokumente on parem skannida hallskaalas. Hallskaalas skannides valib programm optimaalse heleduse väärtuse automaatselt.

Hallskaala skannimisrežiim säilitab skannitud tekstis rohkem teavet tähtede kohta, et saada paremaid OCR-i tulemusi keskmise või kehva kvaliteediga dokumentide tuvastamisel. Kujutise redaktori tööriistade abil saad mõned vead parandada ka käsitsi. Vaata ka: Kui su dokumendi kujutisel on vead ja OCR-i täpsus on väike.

Värvirežiim

Kui sul pole vaja säilitada värvilise dokumendi algvärve, saad dokumenti töödelda must-valges režiimis. See vähendab tunduvalt tulemuseks saadava OCR-projekti suurust ja kiirendab OCR-i protsessi. Kuid vähekontrastsete kujutiste must-valgena töötlemine võib OCR-i kvaliteeti vähendada. Me ei soovita must-valgelt töödelda ka fotosid, ajakirjade lehekülgi ning hiina-, jaapani- ja koreakeelseid tekste.

Näpunäide. Saad ka värviliste ja mustvalgete dokumentide OCR-i kiirendada, valides üksuse Kiire tuvastus vahekaardil Optiline\ntekstituvastus kahekõne aknas Suvandid. Lisateavet tuvastusrežiimide kohta vaata üksusest OCR-i suvandid.

Õige värvirežiimi valimise täiendavaid soovitusi vaata üksusest Skannimise näpunäited.

Kui dokument on must-valgeks teisendatud, ei saa sa enam värve taastada. Värvilise dokumendi saamiseks ava värviliste kujutistega fail või skanni paberdokumenti värvirežiimis.

11/2/2018 4:19:22 PM


Please leave your feedback about this article