Kui programm ei suuda tuvastada kindlaid märke

ABBYY FineReader 14 kasutab andmeid dokumendi keele kohta teksti tuvastades. On võimalik, et programm ei suuda tuvastada mõnda märki (nt koodi numbreid) haruldaste elementidega dokumentides, kuna dokumendi keel ei pruugi neid märke sisaldada. Selliste dokumentide tuvastamiseks saad luua kohandatud keele, mis sisaldab kõiki vajalikke märke. Saad ka luua mitme OCR-keele rühmi ja kasutada neid rühmi dokumente tuvastades.

Kuidas luua kasutaja keelt

  1. Ava Suvandid (klõpsa Tööriistad > Suvandid... selle dialoogiboksis avamiseks), klõpsa Keeled vahekaardil.
  2. Klõpsa Uus... nuppu.
  3. Avanevas dialoogiboksiss vali Loo uus keel juba olemasoleva põhjal suvand, vali keel, mida soovid kasutada uue keele alusena ja klõpsa OK.
  4. Dialoogiboks Keele atribuudid avaneb. Selles dialoogiboksis tee järgmist.
    1. Tipi uue keele nimi.
    2. Keel, mille valisid Uus keel või keelterühm dialoogiboksis, kuvatakse Lähtekeel ripploendis. Sellest ripploendist saad valida erineva keele.
    3. Üksus Tähestik sisaldab baaskeele tähestikku. Kui soovid redigeerida tähestikku, klõpsa nuppu.
    4. Üksuse Sõnastik suvandirühm sisaldab sõnastiku jaoks mitut suvandit, mida kasutatakse programmi poolt teksti tuvastamisel ja tulemuste kontrollimisel:
      • Puudub
        Keelel pole sõnastikku.
      • Sisesõnastik
        Kasutatakse programmi sisseehitatud sõnastikku.
      • Kasutajasõnastik
        Klõpsa Redigeeri... nuppu, et määrata sõnastiku terminid või importida olemasolev kohandatud sõnastik või Windows-1252 kodeeringus tekstifail (terminid peavad olema eraldatud tühikute või teiste tähestikus puuduvate märkidega).
        Kasutaja sõnastikust pärinevaid sõnu ei märgita valesti kirjutatuiks, kui tuvastatud teksti õigekiri on kontrollitud. Võimalik, et need kirjutatakse läbivalt väiketähtedega või läbivalt suurtähtedega või suurtähega sõna alguses.
Sõna sõnastikus Sõnad, mida ei peeta valesti kirjutatuiks õigekirja kontrollimisel
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Üksus Tavaline väljend lubab sul luua kasutaja sõnastiku regulaaravaldiste abil.
    Vaata ka: Regulaaravaldised.
  1. Keeltel võib olla mitu täiendavat atribuuti. Nende atribuutide muutmiseks klõpsa Täpsemalt... nuppu, et avada Keele täpsemad atribuudid dialoogiboksis, kus saad määrata järgmist.
    • Märgid, mis võivad sõna alustada või lõpetada
    • Mittetähelised märgid, mis võivad ilmuda sõnadest eraldi
    • Märgid, mis võivad sõnades esineda, kuid mida peaks eirama
    • Märgid, mis ei saa ilmuda selle keele abil tuvastatud tekstides (keelatud märgid).
    • Üksus Tekst võib sisaldada araabia ja rooma numbreid ning lühendeid suvand
  2. Saad nüüd valida äsja loodud keele, valides OCR-keeled.
    Lisateavet OCR-keelte kohta vaata OCR-keeled.

Kasutaja keel salvestatakse vaikimisi OCR-projekti kausta. Samuti saad salvestada kõik kasutaja etalonid ja kasutaja keeled üksikfailina. Selleks ava Suvandid (klõpsa Tööriistad > Suvandid... selle dialoogiboksis avamiseks), klõpsa Optiline\ntekstituvastus vahekaardil ja seejärel klõpsa Salvesta etalonid ja keeled... nuppu.

Keelerühma loomine

Kui kavatsed kasutada kindlat keelerühma alaliselt, võid soovi korral keeled mugavuse huvides rühmaks koondada.

  1. Ava Suvandid (klõpsa Tööriistad > Suvandid... selle dialoogiboksi avamiseks) ja klõpsa Keeled vahekaardil.
  2. Klõpsa Uus... nuppu.
  3. Vali Uus keel või keelterühm dialoogiboksis Loo uus keelterühm suvand ja klõpsa OK.
  4. Dialoogiboks Keelterühma atribuudid avaneb. Selles dialoogiboksi määra keelerühmale nimi ja vali rühma soovitud keeled.
    Kui tead, et sinu tekst ei sisalda teatud märke, võid soovi korral need nn keelatud märgid otsesõnu määrata. Nii tehes võib tõusta OCR-i kiirus ja täpsus. Nende märkide määramiseks klõpsa Täpsemalt... nuppu Keelterühma atribuudid dialoogiboksis ja sisesta keelatud märgid Keelatud märgid väljal.
  5. Klõpsa ikooni OK.

Uus rühm ilmub keelte ripploendis peamisel tööriistaribal.

Kasutaja keelerühmad salvestatakse vaikimisi OCR-projekti kaustas. Samuti saad salvestada kõik kasutaja etalonid ja kasutaja keeled üksikfailina. Selleks ava Suvandid (klõpsa Tööriistad > Suvandid... selle dialoogiboksis avamiseks), klõpsa Optiline\ntekstituvastus vahekaarti ja seejärel klõpsa Salvesta etalonid ja keeled... nuppu.

Näpunäide. Keelerühma valimiseks saad kasutada keelte ripploendit peamisel tööriistaribal.

  1. Vali Veel keeli... keelte ripploendilt peamisel tööriistaribal.
  2. Vali Keelteredaktor dialoogiboksis Määra OCRi keeled käsitsi suvand.
  3. Vali soovitud keeled ja klõpsa OK.

02.11.2018 16:19:22


Please leave your feedback about this article