Slovníček pojmov

A

ABBYY Hot Folder je plánovací program umožňujúci používateľom vybrať priečinok so snímkami a nastaviť čas spracovania snímok v tomto priečinku. Program ABBYY FineReader automaticky spracuje snímky z vybratého priečinka.

ABBYY Screenshot Reader je aplikácia umožňujúca používateľom vytvárať snímky obrazovky a rozpoznávať na nich text.

ADF Automatic Document Feeder – automatický podávač dokumentov – je zariadenie, ktoré automaticky podáva dokumenty do skenera. Skener so zariadením ADF dokáže naskenovať viaceré strany bez potreby manuálneho zásahu. Program ABBYY FineReader môže pracovať aj s viacstranovými dokumentmi.

ADRT® (Adaptive Document Recognition Technology – technológia prispôsobiteľného rozpoznávania dokumentov) je technológia zvyšujúca kvalitu konverzie viacstranových dokumentov. Táto technológia umožňuje napríklad rozpoznávať prvky ako záhlavia, hlavičky, päty, poznámky pod čiarou, číslovanie strán a podpisy.

Aktivácia je proces získavania špeciálneho kódu od spoločnosti ABBYY, ktorý používateľovi umožňuje používať svoju kópiu produktu na danom počítači v plnom režime.

Aktívna oblasť je aktuálne vybratá oblasť snímky, ktorú možno odstrániť, presunúť alebo upraviť. Ak chcete aktivovať oblasť, kliknite na ňu. Rám ohraničujúci aktívnu oblasť je hrubý a má rukoväte, ktorých ťahaním je možné zmeniť jej veľkosť.

Analýza dokumentu je proces identifikácie logickej štruktúry dokumentu a oblastí, ktoré obsahujú rôzne typy údajov. Analýza dokumentu sa môže vykonať automaticky alebo manuálne.

Automatizovaná úloha: Súčasť programu ABBYY FINEREADER 14 na správu úloh umožňujúca vytváranie, nastavovanie a spúšťanie úloh programu ABBYY FineReader.

D

dpi (dots per inch – počet bodov na palec) je miera rozlíšenia snímky.

Naspäť na začiatok

E

Efekty písma je vzhľad písma (napr. tučné, kurzíva, podčiarknuté, prečiarknuté, dolný index, horný index, malé písmená).

F

Farebný režim určuje, či sa majú zachovať farby dokumentu. Čiernobiele snímky vytvoria menšie projekty OCR a rýchlejšie sa spracúvajú.

H

Heslo na otvorenie dokumentu je heslo, ktoré používateľom znemožní otvoriť dokument PDF, pokiaľ nezadajú autorom stanovené heslo.

Heslo na povolenia je heslo, ktoré bráni používateľom vytlačiť a upravovať dokument vo formáte PDF, pokiaľ nezadajú autorom určené heslo. Ak sú pre dokument vybraté určité nastavenia zabezpečenia, iní používatelia nebudú môcť tieto nastavenia zmeniť, pokiaľ nezadajú heslo.

Hlavičky a päty sú snímky alebo text v hornom alebo dolnom okraji strany. Hlavičky sú umiestnené v hornej časti strany a päty sú umiestnené v dolnej časti.

I

ID podpory je jedinečný identifikátor sériového čísla obsahujúci informácie o licencii a počítači, na ktorom sa licencia používa. ID podpory poskytuje dodatočnú ochranu a kontroluje sa personálom technickej podpory pred poskytnutím technickej podpory.

Identifikácia produktu sa generuje automaticky ma základe konfigurácie hardvéru pri aktivácii programu ABBYY FineReader na danom počítači. Neobsahuje žiadne osobné informácie ani informácie o softvéri alebo údajoch uložených v počítači.

Ignorované znaky sú akékoľvek nepísmenové znaky v slovách (napr. znaky slabík alebo značky prízvuku).  Tieto znaky sa počas kontroly pravopisu ignorujú.

Invertovaná snímka je snímka s bielymi znakmi vytlačenými na tmavom pozadí.

Naspäť na začiatok

J

Jas je parameter snímky úmerný množstvu bielej farby v snímke. Zvýšením jasu bude snímka belšia. Výberom vhodnej hodnoty jasu sa zvyšuje kvalita rozpoznávania. Pozrite tiež: Tipy týkajúce sa skenovania.

K

Klávesové skratky sú klávesy alebo kombinácie klávesov, ktoré pri stlačení spustia konkrétnu akciu. Pomocou klávesových skratiek môžete výrazne zvýšiť svoju produktivitu.

Kódová stránka je tabuľka určujúca súvis medzi znakmi a ich kódmi. Používatelia môžu vyberať požadované znaky z dostupných znakov na kódovej stránke.

L

License Manager je nástroj na správu licencií programu ABBYY FineReader a aktiváciu ABBYY FineReader 14 Corporate.

Ligatúra je kombinácia dvoch alebo viacerých „zlepených“ znakov (napríklad fi, fl, ffi). Rozdelenie takýchto znakov je pre program ABBYY FineReader zložité. Tým, že sa s nimi zaobchádza ako s jedným znakom, sa zvyšuje presnosť rozpoznávania OCR.

M

Možnosti projektu OCR je skupina možností, ktoré možno vybrať v dialógovom okne Možnosti (toto dialógové okno otvorte kliknutím na Nástroje > Možnosti...). Tieto možnosti zahŕňajú aj používateľské jazyky a vzory. Možnosti projektu OCR je možné uložiť a potom použiť v ďalších projektoch OCR.

N

Nastavenia zabezpečenia PDF sú obmedzenia, ktoré bránia otvoreniu, úprave, kopírovaniu alebo tlači dokumentu vo formáte PDF. Medzi tieto nastavenia patria: heslá na otváranie dokumentov, heslá na povolenia a úrovne šifrovania.

Neisté slová sú slová obsahujúce jeden alebo viac neistých znakov.

Neisté znaky sú znaky, ktoré možno neboli programom rozpoznané správne.

Neproporcionálne písmo je písmo (napríklad Courier New), v ktorom všetky znaky zaberajú rovnaký priestor. Pre lepšie OCR výsledky v prípade neproporcionálnych písiem, na karte OCR dialógového okna Možnosti vyberte Písací stroj v skupine možností Typ dokumentu.

Naspäť na začiatok

O

Oblasť čiarového kódu je oblasť snímky, ktorá obsahuje čiarový kód.

Oblasť je časť snímky ohraničená rámom a obsahujúca určitý typ údajov. Pred vykonaním rozpoznávania OCR určí program ABBYY FineReader oblasť textu, obrázka, tabuľky a čiarového kódu, aby mohol určiť, ktoré časti snímky a v akom poradí majú byť rozpoznané.

Oblasť obrázka je oblasť snímky, ktorá obsahuje obrázok. Tento typ oblasti môže ohraničovať skutočný obrázok alebo akýkoľvek iný objekt, ktorý by sa mal v rozpoznanom texte zobraziť ako obrázok (napr. časť textu).

Oblasť obrázka na pozadí je oblasť snímky , ktorá obsahuje obrázok, na ktorom je vytlačený text.

Oblasť rozpoznávania je oblasť snímky, ktorú by mal program ABBYY FineReader analyzovať automaticky.

Oblasť tabuľky je oblasť snímky obsahujúca údaje v tabuľkovej forme. Keď program číta oblasti tohto typu, nakreslí zvislé a vodorovné oddeľovače vnútri oblasti tak, aby vznikla tabuľka. Táto oblasť sa potom vo výstupnom texte vykreslí ako tabuľka.

Oblasť textu je oblasť snímky, ktorá obsahuje text. Oblasti textu by mali obsahovať iba text v jednom stĺpci.

OCR (Optical Character Recognition – optické rozpoznávanie znakov) je technológia, ktorá umožňuje počítačom čítať text, detegovať obrázky, tabuľky a ďalšie prvky formátovania.

Oddeľovače sú symboly, ktoré môžu oddeľovať slová (napr. /, \, pomlčka), a ktoré sú od samotných slov oddelené medzerami.

Ovládač je softvérový program ovládajúci periférne počítačové zariadenia (napr. skener, monitor, atď.).

P

Paradigma je skupina všetkých gramatických tvarov slova.

PDF (Portable Document Format – prenosný formát dokumentov) je rozšírený formát dokumentov. Súbor PDF vyzerá rovnako bez ohľadu na to, na akom počítači sa zobrazuje, vďaka podrobným popisom textu, písiem a grafiky, ktoré obsahuje.

PDF so značkami je dokument vo formáte PDF obsahujúci informácie o štruktúre dokumentu, napríklad o jeho logických častiach, obrázkoch a tabuľkách. Štruktúra dokumentu je zakódovaná v značkách PDF. Tok súboru PDF s takýmito značkami sa môže zmeniť, aby zodpovedal rôznym veľkostiam obrazoviek a zobrazoval sa správne aj na vreckových zariadeniach.

Ponuka skratiek je ponuka, ktorá sa zobrazí po kliknutí pravým tlačidlom na určitý prvok, ako napríklad oblasť alebo inú časť dokumentu.

Projekt OCR je projekt vytvorený programom ABBYY FineReader na spracovanie dokumentu. Obsahuje snímky strán dokumentu, ich rozpoznaný text (ak existuje) a nastavenia programu.

Naspäť na začiatok

R

Režim skenovania je parameter skenovania, ktorý určuje, či má byť snímka naskenovaná čiernobielo, v odtieňoch sivej alebo farebne.

Rozlíšenie je parameter skenovania meraný v bodoch na palec (dpi). Pri textoch s veľkosťou písma 10 bodov a viac by sa malo použiť rozlíšenie 300 dpi a pri textoch s menšou veľkosťou písma (9 bodov a menej) sa odporúča rozlíšenie 400 až 600 dpi.

Rozloženie strany je usporiadanie textu, tabuliek, obrázkov, odsekov a stĺpcov na strane. Súčasťou rozloženia strany sú aj písma, veľkosti písma, farby písma, pozadia a orientácie textu.

S

Šablóna oblasti je šablóna obsahujúca informácie o veľkosti a umiestnení oblastí v dokumentoch podobného vzhľadu.

Sériové číslo je jedinečné číslo, ktoré dostanete pri zakúpení programu. Používa sa počas aktivácie.

Skener je zariadenie na vkladanie snímok do počítača.

Skratka jeskrátená podoba slova alebo výrazu (napríklad MS-DOS je skratka pre Microsoft Disk Operating System, OSN je skratka Organizácie spojených národov a pod.).

Systém Omnifont je systém rozpoznávania, ktorý rozpoznáva skupiny znakov v ľubovoľnom písme bez predchádzajúceho učenia.

T

Typ dokumentu je parameter udávajúci, ako bol pôvodný text vytlačený (napr. na laserovej tlačiarni, písacom stroji a pod.). V prípade textov vytlačených na laserovej tlačiarni vyberte  Automaticky, v prípade textov napísaných na písacom stroji Písací stroj, v prípade faxov vyberte Fax.

U

Učenie je postup vytvorenia súvislosti medzi snímkou znaku a samotným znakom. Pozrite tiež: Ak vytlačený dokument obsahuje neštandardné písma.

Úloha programu ABBYY FineReader je súbor nadväzných krokov, ktoré musí program vykonať na spracovanie dokumentu.  ABBYY FineReader 14 obsahuje množstvo vstavaných úloh pre najbežnejšie potreby spracovávania dokumentov. Používatelia môžu vytvoriť aj svoje vlastné úlohy. Vstavané úlohy je možné spustiť v okne Nová úloha.

Unicode je medzinárodný štandard kódovania textu vyvinutý konzorciom Unicode (Unicode, Inc.). Štandard Unicode poskytuje ľahko rozšíriteľný 16-bitový systém kódovania symbolov z takmer všetkých súčasných jazykov. Určuje, ako by symboly mali byť zakódované a určuje, ktoré algoritmy a vlastnosti znakov sa majú použiť počas procesu kódovania.

V

Voliteľný spojovník je spojovník (¬)  , ktorý označuje, kde presne by malo byť slovo alebo slovné spojenie nachádzajúce sa na konci riadka rozdelené (napr. slovo „automat“ by malo byť rozdelené ako „auto-mat“). Program ABBYY FineReader nahrádza všetky spojovníky v slovníkových slovách voliteľnými spojovníkmi.

Vzor je množina asociácií medzi spriemerovanými snímkami znaku a ich príslušnými názvami. Vzory sa vytvárajú pri učení programu ABBYY FineReader na konkrétnom texte.

Z

Zakázané znaky sú znaky, o ktorých si myslíte, že sa nikdy neobjavia v rozpoznávanom texte. Zadaním zakázaných znakov sa zvyšuje rýchlosť a kvalita rozpoznávania OCR.

Základný tvar je „slovníkový“ tvar slova (hlavné slová slovníkových hesiel sa spravidla uvádzajú v ich základnom tvare).

Zložené slovo je slovo zložené z dvoch alebo viacerých existujúcich slov. V programe ABBYY FineReader je zložené slovo také slovo, ktoré program nemôže nájsť vo svojom slovníku, ale ktoré sa dá vytvoriť z dvoch alebo viacerých slov v slovníku.

Naspäť na začiatok

02.11.2018 16:19:56


Please leave your feedback about this article