Ak papierovy dokument obsahuje nestandardne pisma

Na zlepšenie kvality rozpoznávania OCR v dokumentoch s ozdobnými písmami alebo v dokumentoch so špeciálnymi znakmi (napr. matematickými symbolmi) môžete použiť režim tréningu.

Poznámka: V iných prípadoch sa režim tréningu neodporúča používať, pretože prínosy v kvalite rozpoznávania budú len bezvýznamné v porovnaní s časom a úsilím, ktoré na tréning vynaložíte.

V režime tréningu sa vytvorí používateľský vzor, ktorý môže byť použitý pri optickom rozpoznávaní OCR celého textu.

Používanie používateľských vzorov

Používanie vzoru na rozpoznávanie dokumentu:

  1. Otvorte dialógové okno Možnosti (Nástroje >Možnosti…) a potom kliknite na kartu Čítať .
  2. Pod Tréning vyberte možnosť Používať iba používateľský vzor.

Poznámka: Ak vyberiete možnosť Používať vstavané a používateľské vzory, program ABBYY FineReader 12 použije na optické rozpoznávanie OCR ako používateľské, tak aj prednastavené (vstavané) vzory.

  1. Kliknite na Editor vzorov….
  2. V dialógovom okne Editor vzorov vyberte požadovaný vzor a potom kliknite na OK.
  3. V hlavnom okne programu ABBYY FineReader kliknite na tlačidlo Čítať.

Vytvorenie a tréning používateľského vzoru

Výučba používateľského vzoru na rozpoznávanie nových znakov a spojení:

  1. Otvorte dialógové okno Možnosti (Nástroje >Možnosti…) a potom kliknite na kartu Čítať .
  2. Pod Tréning vyberte Používať vstavané a používateľské vzory alebo Používať iba používateľský vzor.
  3. Vyberte možnosť Čítanie s tréningom.
  4. Kliknite na tlačidlo Editor vzorov….

Poznámka: Tréning vzoru nie je podporovaný u ázijských jazykov.

  1. V dialógovom okne Editor vzorov kliknite na položku Nový…
  2. Otvorí sa dialógové okno Vytvoriť vzor. Zadajte názov používateľského vzoru a kliknite na OK.
  3. Dialógové okno Editor vzorov a Možnosti zatvoríte v oboch prípadoch kliknutím na tlačidlo OK.
  4. V hornej časti okna Snímka na paneli s nástrojmi kliknite na Čítať.

Ak program ABBYY FineReader narazí na neznámy znak, otvorí sa dialógové okno Trénovanie vzoru so zobrazeným neznámym znakom.

  1. Naučte program čítať nové znaky a spojenia.

Spojenie je kombináciou dvoch alebo troch "zlepených" znakov (napríklad fi, fl, ffi a pod.) a s ktorých rozdelením má program ťažkosti. Preto je lepšie pokladať ich za jeden zložený znak, čím sa dosiahnu lepšie výsledky.

Poznámka: Slová vytlačené tučným písmom alebo kurzívou, alebo slová nachádzajúce sa v dolnom/hornom indexe je možné zachovať nerozpoznané – pomocou nastavenia v ponuke Efekty.

Kliknutím na tlačidlo Späť sa vrátite späť na predchádzajúci naučený znak. Rám preskočí späť na predchádzajúce miesto a posledná trénovaná zodpovedajúca dvojica "snímka znaku – znak klávesnice" bude zo vzoru odstránená. Tlačidlom Späť sa prechádza medzi znakmi slova, nie medzi slovami.

Dôležité upozornenie!

  • Program ABBYY FineReader môžete učiť čítať iba tie znaky, ktoré sú zahrnuté v abecede jazyka rozpoznávania. Ak chcete program naučiť čítať znaky, ktoré nemožno zadať prostredníctvom klávesnice, na vyjadrenie týchto neexistujúcich znakov použite kombináciu dvoch znakov alebo skopírujte požadované znaky z dialógového okna Vloženie znaku (kliknutím na tlačidlo ).
  • Každý vzor môže obsahovať až 1000 nových znakov. Napriek tomu sa snažte vyhýbať vytváraniu prílišného množstva spojení, pretože by to mohlo mať negatívny vplyv na kvalitu rozpoznávania OCR.

Výber používateľského vzoru

Program ABBYY FineReader vám umožňuje používať vzory a zvýšiť tak kvalitu rozpoznávania OCR

  1. V ponuke Nástroje kliknite na Editor vzorov…
  2. V dialógovom okne Editor vzorov vyberte zo zoznamu dostupných vzorov požadovaný vzor a kliknite na Aktivovať.

Dôležité informácie:

  1. Podobné, no rozdielne znaky rozpoznáva program ABBYY FineReader ako jeden a ten istý znak. Napr. rovné úvodzovky ('), ľavé anglické úvodzovky(‘) a pravé anglické úvodzovky (’) sa do vzoru uložia ako jeden znak (rovné úvodzovky). Takže v rozpoznanom texte nebudú nikdy použité pravé a ľavé apostrofy, dokonca ani v prípade použitia možnosti tréningu.
  2. Pri niektorých snímkach znakov program ABBYY FineReader vyberie a určí príslušný znak klávesnice na základe okolitého kontextu. Napríklad snímka malého kruhu bude rozpoznaná ako písmeno O, ak sú hneď vedľa neho písmená a ako číslo 0, ak sú vedľa neho číslice.
  3. Vzor možno použiť len pre dokumenty s rovnakým typom písma, veľkosťou písma a rozlíšením ako má dokument, ktorý bol použitý na vytvorenie vzoru.
  4. Aby ste mohli využívať vzory neskôr, uložte ich do súboru. Podrobné informácie nájdete v časti "Čo je to dokument programu FineReader?".
  5. Ak potrebujete rozpoznávať texty s iným typom písma, deaktivujte používateľský vzor vybratím možnosti Používať iba vstavané vzory v ponuke Nástroje > Možnosti…. > Čítať.

Úprava používateľského vzoru

Môže sa stať, že pred spustením rozpoznávania OCR budete chcieť upraviť novovytvorený vzor. Nesprávne naučený vzor môže mať negatívny vplyv na kvalitu rozpoznávania OCR. Vzor by mal obsahovať iba celé znaky alebo spojenia. Znaky s odseknutými okrajmi a znaky s nesprávnou zhodou písmen by sa mali zo vzoru odstrániť.

  1. V ponuke Nástroje kliknite na Editor vzorov…
  2. Dialógové okno Editor vzorov sa otvorí. Vyberte požadovaný vzor a kliknite na tlačidlo Upraviť….
  3. V otvorenom dialógovom okne Používateľský vzor vyberte znak a kliknite na tlačidlo Vlastnosti….

V otvorenom dialógovom okne:

  • Zadajte písmeno zodpovedajúce znaku v poli Znak
  • Zadajte požadovaný efekt písma (tučné, kurzíva, horný index a dolný index) v poli Efekty.

Kliknite na tlačidlo Zmazať v dialógovom okne Používateľský vzor a odstráňte znak, ktorého výučba nebola správna.

14.01.2020 17:26:21

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.