Als het programma niet alle tekens herkent

ABBYY FineReader 14 gebruikt data over de documenttaal tijdens het herkennen van tekst. Het is mogelijk dat het programma moeite heeft met het herkennen van tekens met ongebruikelijke elementen (zoals codenummers), omdat de documenttaal deze tekens niet bevat. Om dergelijke documenten toch te herkennen, kunt u een aangepaste taal maken met alle benodigde tekens. U kunt ook groepen maken van verschillende OCR-talen en deze groepen gebruiken tijdens het herkennen van documenten.

Zo maakt u een gebruikerstaal

  1. Open het Opties dialoogvenster (klik op Gereedschappen > Opties... om het dialoogvenster te openen), klik op de Talen tabblad.
  2. Klik op de Nieuw... knop.
  3. In het dialoogvenster dat verschijnt, selecteert u de Een nieuwe taal maken op basis van een bestaande optie. Selecteer de taal die u wilt gebruiken als basis voor de nieuwe taal en klik op OK.
  4. Het Taaleigenschappen dialoogvenster wordt geopend. In dit dialoogvenster doet u het volgende:
    1. Typ een naam voor uw nieuwe taal.
    2. De taal die u hebt geselecteerd in het Nieuwe taal of groep dialoogvenster wordt weergegeven in de Brontaal vervolgkeuzelijst. U kunt een andere taal kiezen in deze vervolgkeuzelijst.
    3. Deze Alfabet bevat het alfabet van de basistaal. Als u het alfabet wilt bewerken klikt u op de knop.
    4. De Woordenboek optiegroep bevat diverse opties met betrekking tot het woordenboek die door het programma worden gebruikt voor het herkennen van de tekst en het controleren van het resultaat:
      • Geen
        De taal heeft geen woordenboek.
      • Ingebouwd woordenboek
        Het geïntegreerde woordenboek van het programma wordt gebruikt.
      • Gebruikerswoordenboek
        Klik op de Bewerken... knop om woordenboektermen op te geven of om een bestaand aangepast woordenboek of een tekstbestand met een Windows-1252-codering te importeren (termen moeten zijn gescheiden door spaties of tekens die niet in het alfabet voorkomen).
        Woorden uit het gebruikerswoordenboek worden niet gemarkeerd als foutief tijdens de spellingcontrole van de herkende tekst. Ze mogen geheel met kleine letters of hoofdletters worden geschreven of alleen beginnen met een hoofdletter.
Woord in het woordenboek Woorden die niet als foutief worden beschouwd tijdens een spellingcontrole
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Met de Reguliere expressie kunt u een gebruikerswoordenboek met reguliere expressies samenstellen.
    Zie ook: Reguliere expressies.
  1. Talen kunnen verschillende extra eigenschappen hebben. Om deze eigenschappen te wijzigen klikt u op de Geavanceerd... knop om het Geavanceerde taaleigenschappen dialoogvenster te openen, waarin u het volgende kunt aangeven:
    • Tekens waarmee een woord kan beginnen of eindigen
    • Tekens die geen letters zijn die op zichzelf mogen voorkomen
    • Tekens die in woorden mogen voorkomen maar genegeerd moeten worden
    • Tekens die volgens deze taal niet in de herkende tekst kunnen voorkomen (verboden tekens)
    • De Tekst kan Arabische cijfers, Romeinse cijfers en afkortingen bevatten optie
  2. U kunt nu de nieuw gemaakte taal kiezen bij het kiezen van OCR-talen.
    Voor meer info over OCR-talen, zie OCR-talen.

Standaard wordt de gebruikerstaal opgeslagen in de map van het OCR-project. U kunt ook alle gebruikerspatronen en talen opslaan als een enkel bestand. Om dit te doen opentu het Opties dialoogvenster (klik op Gereedschappen > Opties... om het dialoogvenster te openen), klik op het OCR tabblad en klik op de Patronen en talen opslaan... knop.

Een taalgroep maken

Als u een bepaalde talencombinatie regelmatig gaat gebruiken, wilt u mogelijk de talen groeperen.

  1. Open het Opties dialoogvenster (klik op Gereedschappen > Opties... om het dialoogvenster te openen) en klik op het Talen tabblad.
  2. Klik op de Nieuw... knop.
  3. In het Nieuwe taal of groep dialoogvenster, selecteert u de Een nieuwe taalgroep maken optie en klikt u op OK.
  4. Het Taalgroepeigenschappen dialoogvenster wordt geopend. In dit dialoogvenster geeft u de naam op voor de taalgroep en selecteert u de talen die u wilt opnemen in de groep.
    Als u weet dat bepaalde tekens niet in uw tekst zullen voorkomen, kunt u deze zogeheten verboden tekens expliciet specificeren. Hiermee kunt u de snelheid en de nauwkeurigheid van de OCR vergroten. Om deze eigenschappen te specificeren, klikt u op de Geavanceerd... knop in het Taalgroepeigenschappen dialoogvenster en voert u de verboden tekens in in het Verboden tekens veld.
  5. Klik op OK.

De nieuwe groep wordt weergegeven in de vervolgkeuzelijst met talen op de hoofdwerkbalk.

De standaardinstelling is dat taalgroepen worden opgeslagen in de map van het OCR-project. U kunt ook alle gebruikerspatronen en talen opslaan als een enkel bestand. Om dit te doen opentu het Opties dialoogvenster (klik op Gereedschappen > Opties... om het dialoogvenster te openen), klik op het OCR tabblad en klik op de Patronen en talen opslaan... knop.

Tip. U kunt de vervolgkeuzelijst met talen op de hoofdwerkbalk gebruiken om een taalgroep te selecteren.

  1. Selecteer Meer talen... in de vervolgkeuzelijst met talen op de hoofdwerkbalk.
  2. In het Taleneditor dialoogvenster, selecteert u de Handmatig OCR-talen specificeren optie.
  3. Selecteer de gewenste talen en klik op OK.

02.11.2018 16:19:46


Please leave your feedback about this article