Kui sinu trükitud dokument sisaldab ebastandardseid fonte

Kui soovid tuvastada dokumenti, mis sisaldab dekoratiivseid fonte või erimärke (sh matemaatilised sümbolid), soovitame tuvastamise täpsuse tõstmiseks kasutada õpetamisrežiimi.

Õpetamisrežiimi pole soovitatav kasutada muudel juhtudel, kuna tuvastuskvaliteedi paranemine on tähtsusetu võrreldes õpetamisele kulutatud aja ja jõupingutustega.

Õpetamisrežiimis luuakse kasutaja etalon, mida saab kasutada kogu teksti optilisel tuvastamisel.

Kasutaja etalonide kasutamine

Kasutaja etalonide kasutamine dokumendi tuvastamisel.

  1. Klõpsa ikooni Tööriistad > Suvandid..., et avada Suvandid dialoogiboks ja klõpsa Optiline\ntekstituvastus vahekaardil.
  2. Vali Kasuta kasutaja mustreid suvand.
    Kui valitakse Samuti kasuta sisseehitatud mustreid suvand suvandi alt, Kasuta kasutaja mustreid kasutab ABBYY FineReader oma sisseehitatud etalone lisaks sinu loodud mis tahes etalonidele.
  3. Klõpsa Etaloniredaktor... nuppu.
  4. Dialoogiboksis Etaloniredaktor vali etalon ja klõpsa OK.
  5. Klõpsa nuppu peamisel tööriistaribal, mis asub OCR-redaktori akna ülaosas.

Kasutaja etaloni loomine ja õpetamine

Selleks, et õpetada kasutaja etalonile uute märkide ja liitmärkide tuvastamist, toimi järgmiselt.

  1. Klõpsa ikooni Tööriistad > Suvandid..., et avada Suvandid dialoogiboks ja klõpsa Optiline\ntekstituvastus vahekaardil.
  2. Vali Kasuta koolitamist uute tähemärkide ja liitmärkide tuvastamiseks suvand.
    Kui valitakse Samuti kasuta sisseehitatud mustreid suvand Kasuta koolitamist uute tähemärkide ja liitmärkide tuvastamiseks suvandi alt, kasutab ABBYY FineReader oma sisseehitatud etalone lisaks sinu loodud mis tahes etalonidele.
  3. Klõpsa Etaloniredaktor... nuppu.
    Etaloni õpetamine pole Aasia keelte puhul toetatud.
  4. Dialoogiboksis Etaloniredaktor klõpsa Uus... nuppu.
  5. Dialoogiboksis Loo etalon määra uuele etalonile nimi ja klõpsa OK.
  6. Klõpsa ikooni OK dialoogiboksis Etaloniredaktor ja seejärel klõpsa nuppu OK dialoogiboksis Suvandid .
  7. Klõpsa nuppu tööriistaribal, mis asub kujutise paani ülaosas.
    Kui programm ei suuda mõnda märki tuvastada, Etaloni õpetamine avaneb dialoogiboks ja kuvab selle märgi.
  8. Õpeta programm lugema uusi märke ja liitmärke.
    Liitmärk on kahe või kolme "kokku liimitud" märgi kombinatsioon (nt fi, fl, ffi jne), mida programmil on raske eristada. Tegelikult saavutatakse paremad tulemused, kui selliseid kombinatsioone käsitletakse üksikute liitmärkidena.
    Paksu kirjaga, kursiivis või üla- ja alaindeksi sõnad võib tuvastatud teksti alles jätta, valides vastavad suvandid Efektide alt..
    Eelmise õpetatud märgi juurde tagasi minemiseks klõpsa Tagasi nuppu. Raam hüppab oma eelmisse asukohta ja viimane õpetatud vastavus "märgi kujutis – klaviatuuri märk" eemaldatakse etalonist. Nupp Tagasi liigub ühe sõna märkide vahel ja ei liigu sõnade vahel.

Tähtis!

  • Saad ABBYY FineReader 14 õpetada lugema ainult redaktori keele tähestikus sisalduvaid märke. Et õpetada programm lugema märke, mida ei saa sisestada klaviatuurilt, kasuta seesuguste olematute märkide tähistamiseks kahe märgi kombinatsiooni või kopeeri soovitud märk Sisesta märk (klõpsa  selle dialoogiboksi avamiseks).
  • Iga etalon võib sisaldada kuni 1000 uut märki. Hoidu siiski liiga paljude liitmärkide loomisest, kuna see võib kahjustada tuvastamise kvaliteeti.

Kasutaja etaloni valimine

ABBYY FineReader võimaldab sul kasutada etalone tuvastamise kvaliteedi parandamiseks.

  1. Klõpsa ikooni Tööriistad > Etaloniredaktor....
  2. Dialoogiboksis Etaloniredaktor vali nimekirjast üks etalon ja klõpsa Kasuta nuppu.

Mõned olulised punktid meeles pidamiseks.

  1. Mõnikord ei tee programm vahet väga sarnastel, kuid siiski erinevatel märkidel ja tunnistab need üheks ja samaks märgiks. Näiteks püstised ('), 6- (‘) ja 9-kujulised (’) ülakomad salvestatakse etalonis ühe märgina (püstine ülakoma). See tähendab, et 6- ja 9-kujulisi ülakomasid ei kasutata tuvastatud tekstis kunagi, isegi kui sa prooviksid neid õpetada.
  2. Mõnede märkide kujutiste korral valib ABBYY FineReader 14 sobiva klahvistiku märgi ümbritseva konteksti põhjal. Näiteks tuvastatakse väikse ringi kujutis tähena (O), kui kohe selle kõrval on tähed, ja numbrina (0), kui selle kõrval on numbrid.
  3. Etaloni saab kasutada ainult selliste dokumentidega, millel on sama font, fondisuurus ja eraldusvõime nagu etaloni loomisel kasutatud dokumendil.
  4. Saad oma etaloni salvestada faili ja kasutada seda muudes optilise tuvastamise (OCR) projektides. Vaata ka: OCR-projektid.
  5. Muudes fontides tekstide kogumi tuvastamiseks veendu, et lülitad kasutaja etaloni välja. Selleks klõpsa ikooni Tööriistad > Suvandid..., et avada Suvandid dialoogiboks, klõpsa Optiline\ntekstituvastus vahekaardil ja vali Kasuta siseetalone suvand.

Kasutaja etaloni redigeerimine

Enne optilise tuvastamise käivitamist saad redigeerida oma vastloodud etaloni. Valesti õpetatud etalon võib kahjustada optilise tuvastamise kvaliteeti. Etalon võib sisaldada üksnes terviklikke märke või liitmärke. Lõigatud nurkadega ja valede tähepaaridega märgid tuleb etalonist eemaldada.

  1. Klõpsa ikooni Tööriistad > Etaloniredaktor....
  2. Dialoogiboksis Etaloniredaktor vali etalon, mida soovid redigeerida ja klõpsa Redigeeri... nuppu.
  3. Dialoogiboksis Kasutaja-etalon vali märk ja klõpsa Atribuudid... nuppu.

Avanevas dialoogiboksis toimi järgmiselt.

  • Sisesta Märk väljal märgile vastav täht.
  • Määra Efekti väljal fondi soovitud efekt (paks või kursiivkiri, üla- või alaindeks).

Valesti õpetatud märgi kustutamiseks klõpsa Kustuta nuppu Kasutaja-etalon dialoogiboksis.

02.11.2018 16:19:22


Please leave your feedback about this article