Sõnastik

A

ABBYY FineReaderi tegum on järjestikuste sammude kogum, mida programm peab dokumendi töötlemiseks sooritama.  ABBYY FineReader 14 sisaldab hulka sisseehitatud tegumeid levinuimate dokumendi töötlemise vajaduste jaoks. Kasutajad saavad samuti luua oma kohandatud tegumeid. Sisseehitatud ülesandeid saab käivitada uue ülesande aknas.

ABBYY Hot Folder on planeerimisrakendus, mis võimaldab kasutajatel valida kujutistega kausta ja määratleda aja selles kaustas olevate kujutiste töötlemiseks. ABBYY FineReader töötleb valitud kausta kujutisi automaatselt.

ABBYY Screenshot Reader on rakendus, mis võimaldab kasutajatel luua ekraanipilte ja neil olevat teksti tuvastada.

ADF (Automaatne dokumendisöötur) on seade, mis annab skannerile automaatselt dokumente ette. ADF-iga skanner võib skannida mitu lehekülge, ilma et kasutaja peaks sekkuma. ABBYY FineReader toetab mitmeleheküljeliste dokumentide töötlemist.

ADRT® (Adaptive Document Recognition Technology, kohanduv dokumentide tuvastamise tehnoloogia) on mitmeleheküljeliste dokumentide teisendamise kvaliteeti parandav tehnoloogia. Näiteks suudab see tuvastada selliseid elemente nagu pealkirjad, päised ja jalused, allmärkused, leheküljenumbrid ja allkirjad.

Aktiivne ala on kujutisel hetkel valitud ala, mida saab kustutada, liigutada või muuta. Ala käivitamiseks klõpsake seda. Toimekat ala ümbritsev raam on paks ja sisaldab nn suurusepidemeid (ruudukesi), mida saab ala suuruse muutmiseks lohistada.

Ala mall on mall, mis sisaldab teavet alade suuruste ja asukohtade kohta sarnase väljanägemisega dokumentides.

Ala on kujutise raamiga ümbritsetud osa, mis sisaldab teatud tüüpi andmeid. Enne tekstituvastust tuvastab ABBYY FineReader teksti-, pildi-, tabeli- ja triipkoodialad, et teha kindlaks, milliseid kujutise osi tuleks tuvastada ja millises järjekorras.

Algvorm on sõna "sõnastikuline" vorm (sõnastiku kirjete märksõnad esitatakse tavaliselt nende algvormides).

Automatiseeritud tegum: ABBYY FINEREADER 14 ülesande haldamise osa, mis võimaldab sul luua, häälestada ja käivitada ABBYY FineReaderi ülesandeid.

Tagasi algusse

D

Dokumendi analüüs on protsess dokumendi loogilise struktuuri ja erinevat tüüpi andmeid sisaldavate alade tuvastamiseks. Dokumenti võib analüüsida automaatselt või käsitsi.

Dokumendi avamise parool on parool, mis takistab kasutajatel PDF-dokumenti avamast, välja arvatud juhul, kui nad sisestavad autori poolt seatud parooli.

Dokumendi tüüp on parameeter, mis annab programmile teada, kuidas lähtetekst trükiti (nt laserprinteril, kirjutusmasinal jne). Laserprinteriga trükitud tekstide korral vali Automaatne, kirjutusmasinal trükitud tekstide korral vali Kirjutusmasin, fakside puhul vali Faks.

dpi (punkte tolli kohta) on kujutise eraldusvõime mõõtühik.

Draiver on arvuti välisseadmeid (nt skannerit, monitori jms) kontrolliv tarkvara.

E

Ebakindlalt tuvastatud märgid on märgid, mis võivad olla programmi poolt valesti tuvastatud.

Ebakindlalt tuvastatud sõnad on sõnad, mis sisaldavad ühte või mitut ebakindlalt tuvastatud märki.

Eiratud märgid on sõnades leiduvad mittetähelised märgid (nt silp- või rõhumärgid). Neid märke eiratakse õigekirjakontrolli ajal.

Eraldajad on sõnu eraldavad sümbolid (nt /, \, mõttekriips), mis on sõnadest endist tühikutega eraldatud.

Eraldusvõime on skannimise parameeter, mida mõõdetakse punktides tolli kohta (dpi). 10 p ja suuremate fontidega tekstide puhul tuleb kasutada eraldusvõimet 300 dpi; 400 kuni 600 dpi on eelistatav väiksema fondisuurusega tekstide puhul (9 p ja alla selle).

Etalon on keskmistatud märgikujutiste ja nendele vastavate nimede vaheliste seoste komplekt. Etalonid luuakse kui te õpetate ABBYY FineReaderile konkreetset teksti.

Tagasi algusse

H

Heledus on kujutise parameeter, mis peegeldab valge värvi kogust kujutisel. Heleduse suurendamine teeb kujutise "valgemaks". Heleduse sobiva väärtuse määratlemine tõstab tuvastamise kvaliteeti. Vaata ka: Skannimise näpunäited.

K

Käivitamine on ABBYY-lt erilise koodi saamise protsess, mis võimaldab kasutajal oma toote koopiat antud arvutis täisrežiimis kasutada.

Keelatud märgid on märgid, mida sinu arvates tuvastatavas tekstis kunagi ei esine. Keelatud märkide määratlemine tõstab OCR-i kiirust ja kvaliteeti.

Kiirklahvid on klahvid või klahviühendid, mis vajutamisel käivitavad kindla toimingu. Kiirklahvide kasutamine võib teie tööviljakust märgatavalt suurendada.

Kiirmenüü on menüü, mis ilmub millelgi paremklõpsates, näiteks alal või dokumendi muul osal.

Kirjatüübi efektid on kirjatüübi väljanägemine (nt paks, kursiivis, allajoonitud, läbikriipsutatud, alaindeks, ülaindeks, kapiteelkiri).

Koodileht on tabel, mis kehtestab märkide ja märgikoodide vahelised vastavused. Kasutajad saavad valida endale vajalikud märgid koodilehel saadaolevate märkide hulgast.

L

Lehekülje küljendus on teksti, tabelite, piltide, lõikude ja veergude paigutus leheküljel. Fondid, fondisuurused, fontide värvid, teksti taust ja teksti suund on samuti lehekülje küljenduse osa.

License Manager on utiliit, mida kasutatakse ABBYY FineReaderi litsentside haldamiseks ja järgneva programmi käivitamiseks ABBYY FineReader 14 Corporate.

Liitmärk on kahe või enama "kokku kleepunud" märgi ühend (nt fi, fl, ffi). ABBYY FineReaderil on keeruline selliseid märke eraldada. Nende käsitlemine ühe märgina tõstab OCR-i täpsust.

Liitsõna on kahest või enamast olemasolevast sõnast koosnev sõna. ABBYY FineReaderis on liitsõna sõna, mida programm oma sõnastikust ei leia, kuid mille see saab luua kahest või enamast sõnastikus olevast sõnast.

Lühend on sõna või fraasi lühendatud kuju (nt MS-DOS on Microsoft Disk Operating Systemi tähistamiseks, UN on United Nations jne).

Tagasi algusse

O

OCR (optiline tekstituvastus) on tehnoloogia, mis võimaldab arvutitel lugeda teksti ning tuvastada pilte, tabeleid ja muid vorminguelemente.

OCR-projekt on ABBYY FineReaderi poolt dokumendi töötlemiseks loodud projekt. See sisaldab dokumendi lehekülgede kujutisi, nendel tuvastatud teksti (kui seda on) ja programmi seadeid.

OCR-projekti suvandidon komplekt suvandeid, mida saab valida Suvandid kahekõne aknas (klõpsa Tööriistad > Suvandid... selle kahekõne akna avamiseks). Need suvandid sisaldavad ka kasutaja keeli ja etalone. OCR-projekti suvandeid saab salvestada ja kasutada seejärel teistes OCR-projektides.

Õiguste parool on parool, mis takistab teistel kasutajatel PDF-dokumenti printida või redigeerida, kui nad ei tipi autori määratud parooli. Kui dokumendile on seatud mõni turvaseade, ei saa teised kasutajad neid autori määratud parooli tippimata muuta.

Omnifondi süsteem on tuvastussüsteem, mis tuvastab mis tahes kirjatüübi märkide komplekti eelneva õpetamiseta.

Õpetamine on märgi kujutise ja märgi enda vahelise vastavuse kehtestamise protsess. Vaata ka: Kui sinu trükitud dokument sisaldab mittestandardseid kirjatüüpe.

P

Päised ja jalused on lehekülje üla- või alaveerisel olevad kujutised või tekst. Päised asuvad lehekülje ülaosas ja jalused allosas.

Paradigma on sõna kõigi grammatiliste vormide komplekt.

PDF (Portable Document Format) on levinud dokumendivorming. Tänu oma teksti, kirjatüübi ja graafika üksikasjalikele kirjeldustele näeb PDF-fail välja samasugune, vaatamata sellele, millises arvutis seda kuvatakse.

PDF-i turvaseaded on piirangud, mis takistavad PDF-dokumendi avamist, redigeerimist, kopeerimist või printimist. Selliste seadete hulka kuuluvad dokumendi avamise paroolid, õiguste paroolid ja krüpteerimistasemed.

Pildi ala on pilti sisaldav kujutise ala. Sellisel alal võib paikneda tegelik pilt või mis tahes muu objekt (nt tekstiosa), mis tuleks kuvada pildina.

Poolituskriips on sidekriips (¬)  , mis näitab täpse koha, kus tuleb poolitada rea lõpus esinev sõna või sõnaühend (nt tuleks "autoformat" jagada nii: "auto" ja "format"). ABBYY FineReader asendab kõik sõnastiku sõnades leiduvad sidekriipsud poolituskriipsudega.

Pööratud kujutis on kujutis, kus valged tähed on trükitud tumedale taustale.

Püsisammkiri on font (nt Courier New), mille kõik märgid on ühesuguse sammuga. Püsisammkirjas fontide paremate OCR-i tulemuste jaoks Optiline\ntekstituvastus vahekaardil, mille leiad Suvandid kahekõne aknas, vali Kirjutusmasin, Dokumendi tüüp suvandite rühmas.

Tagasi algusse

S

Seerianumber on programmi ostes saadav unikaalne number. Seda kasutatakse käivitamisel.

Sildistatud PDF on PDF-dokument, mis sisaldab teavet dokumendi ehituse kohta, nt loogilised osad, pildid ja tabelid. Dokumendi ehitus on kodeeritud PDF-siltidesse. Selliste siltidega PDF-faili sisu võib erineva suurusega ekraanidel kuvamiseks ümber paigutada ning see on hästi kuvatav ka kaasaskantavatel seadmetel.

Skanner on seade kujutiste arvutisse sisestamiseks.

Skannimisrežiim on skannimise parameeter, mis määrab ära selle, kas kujutis tuleks skannida mustvalgelt, hallskaalas või värviliselt.

T

Tabeli ala on kujutise ala, mis sisaldab andmeid tabeli kujul. Kui programm seda tüüpi ala loeb, joonistab see tabeli moodustamiseks alale püstised ja rõhtsed eraldusjooned. Väljundtekstis esitatakse see ala seejärel tabelina.

Taustapildi ala on pildi ala, mis sisaldab pilti koos selle kohale trükitud tekstiga.

Teksti ala on kujutise ala, mis sisaldab teksti. Teksti alad peavad sisaldama ainult üheveerulist teksti.

Toe ID on seerianumbri kordumatu tuvastaja, mis sisaldab teavet nii litsentsi kui ka seda kasutava arvuti kohta. Toe ID pakub lisakaitset ja tehnilise toe personal kontrollib seda enne tehnilise toe pakkumist.

Toote ID luuakse antud arvutis ABBYY FineReaderi aktiveerimisel automaatselt riistvara konfiguratsiooni põhiselt. See ei sisalda mingeid isikuandmeid või teavet sinu arvutis talletatud tarkvara või andmete kohta.

Triipkoodi ala on triipkoodi sisaldav pildi ala.

Tuvastatav ala on kujutise ala, mida ABBYY FineReader peaks automaatselt analüüsima.

U

Unicode on rahvusvaheline teksti kodeerimise standard, mille on töötanud välja Unicode Consortium (Unicode, Inc.). Unicode'i standard pakub hõlpsasti laiendatavat 16-bitist süsteemi pea kõigi tänapäevaste keelte sümbolite kodeerimiseks. See täpsustab, kuidas tuleks sümboleid kodeerida ja määrab kindlaks, milliseid algoritme ja märgi atribuute tuleb kasutada kodeerimisprotsessi käigus.

V

Värvirežiim määrab ära selle, kas dokumendi värvid tuleks säilitada. Mustvalged kujutised tekitavad väiksemaid OCR-projekte ja on kiiremini töödeldavad.

Tagasi algusse

02.11.2018 16:19:22


Please leave your feedback about this article