Kui programm ei suuda tuvastada mõnda märki

ABBYY FineReader kasutab teksti tuvastamisel andmeid dokumendi keele kohta. On võimalik, et programm ei suuda tuvastada mõnda märki (nt koodnumbreid) tundmatute elementidega dokumentides, kuna dokumendi keel ei sisalda ilmselt neid märke. Selliste dokumentide tuvastamiseks saad luua kohandatud keele, mis sisaldab kõiki vajalikke märke. Samuti saad omistada keelerühmadele mitu keelt ja kasutada tuvastamiseks neid rühmasid.

Kasutajakeele loomine

  1. Klõpsa menüüs Tööriistad suvandit Keelteredaktor…
  2. Klõpsa dialoogiboksis Keelteredaktor valikut Uus….
  3. Vali avanevas dialoogiboksis suvand Loo uus keel juba olemasoleva põhjal, seejärel vali keel, mida kasutatakse sinu uue keele baaskeelena ja klõpsa nuppu OK.
  4. Avaneb dialoogiboks Keele atribuudid. Selles dialoogiboksis tee järgmist.
    1. Tipi uue keele nimi.
    2. Baaskeel, mille varem valisid, kuvatakse ripploendis Lähtekeel. Saad lähtekeelt muuta.
    3. Tähestik sisaldab baaskeele tähestikku. Klõpsa nuppu , kui soovid redigeerida tähestikku.
    4. On mitu rakendusega Sõnastik seotud suvandit, mida kasutatakse programmi poolt teksti tuvastamisel ja tulemuste kontrollimisel:
      • Puudub

Keelel pole sõnastikku.

  • Sisesõnastik

Kasutatakse programmi sisesõnastikku.

  • Kasutajasõnastik

Klõpsa nuppu Redigeeri…, et määrata sõnastikuterminid või importida olemasolev kohandatud sõnastik või Windows-1252 kodeeringus tekstifail (terminid peavad olema eraldatud tühikute või teiste märkidega, mis ei sisaldu tähestikus).

Märkus. Kasutajasõnastikus leiduvaid sõnu ei peeta vigasteks, kui kontrollitakse tuvastatud teksti õigekirja. Võimalik, et need kirjutatakse läbivalt väiketähtedega või läbivalt suurtähtedega või suurtähega sõna alguses.

Sõna on sõnastikus Sõnad, mida ei peeta valeks õigekirja kontrollimisel
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
  • Tavaline väljend

Saad luua kohandatud keele sõnastiku, kasutades regulaaravaldisi.

Lisateavet vt jaotisest "Regulaaravaldised."

  1. Keeltel võib olla mitu täiendavat atribuuti. Nende atribuutide muutmiseks klõpsa nuppu Täpsemalt….

Avaneb dialoogiboks Keele täpsemad atribuudid. Siin saad määrata järgmised parameetrid.

  • Märgid, mis võivad ilmuda sõna lõpus või alguses.
  • Mittetähelised märgid, mis võivad ilmuda sõnadest eraldi.
  • Märgid, mis võivad ilmuda sõnade keskel ja mida tuleks ignoreerida.
  • Märgid, mis võivad ilmuda tekstis, mis tuvastatakse seda sõnastikku kasutades (keelatud märgid).
  • Kõik keelest tuvastatavad märgid.
  • Saad ka lubada suvandi Tekst võib sisaldada araabia ja rooma numbreid ning lühendeid
  1. Saad nüüd valida äsja loodud keele dokumendi keelte määramisel.

Lisateavet dokumendi keelte kohta vt jaotisest "Dokumendi funktsioonid, mille kasutamist võiks enne optilist tekstituvastust kaaluda".

Kasutaja keel salvestatakse vaikimisi FineReaderi dokumendikausta. Saad ka salvestada kõik kasutajakeeled ja kasutaja-etalonid üksikfailina. Selleks klõpsa menüüs Tööriistad ikooni Suvandid…, et avada dialoogiboks Suvandid, klõpsa vahekaarti Tuvastus, seejärel klõpsa käsku Salvesta faili....

Keelerühma loomine

Kui kavatsed kasutada kindlate keelte kombinatsiooni regulaarselt, siis soovid ehk koguda keeled käepärasesse rühma.

  1. Klõpsa menüüs Tööriistad suvandit Keelteredaktor…
  2. Klõpsa dialoogiboksis Keelteredaktor valikut Uus….
  3. Vali dialoogiboksis Uus keel või keelterühm üksus Loo uus keelterühm ja klõpsa nuppu OK.
  4. Sisesta dialoogiboksi Keelterühma atribuudid uue rühma nimi ja vali soovitud keeled.

Märkus. Kui tead, et tekst ei sisalda teatud märke, võid need nn keelatud märgid selgesõnaliselt määrata. Keelatud märkide määramine võib tõsta nii tuvastuse kiirust kui ka kvaliteeti. Keelatud märkide määramiseks klõpsa dialoogiboksis Keelterühma atribuudid nuppu Täpsemalt…. Dialoogiboksis Keelterühma täiendavad omadused tipi väljal Keelatud märgid keelatud märgid.

  1. Klõpsa nuppu OK.

Äsja loodud rühm lisatakse põhiakna ripploendisse Dokumendi keeled tööriistaribal.

Kasutaja keelerühmad salvestatakse vaikimisi FineReaderi dokumendikausta. Saad ka salvestada kõik kasutajakeeled ja kasutaja-etalonid üksikfailina. Selleks klõpsa menüüs Tööriistad ikooni Suvandid…, et avada dialoogiboks Suvandid, klõpsa vahekaarti Tuvastus, seejärel klõpsa käsku Salvesta faili….

Näpunäide.Kui soovid kasutada kindlat keeltekombinatsiooni, saad soovitud keeled ka otse valida, keelterühma loomata.

  1. Vali ripploendist Dokumendi keeled suvand Veel keeli…
  2. Vali dialoogiboksis Keelteredaktor suvand Määra keeled käsitsi.
  3. Vali soovitud keeled ja klõpsa nuppu Tühista.

11/2/2018 5:31:18 PM


Please leave your feedback about this article