Als het programma niet alle tekens herkent

ABBYY FineReader gebruikt gegevens over de documenttaal bij het herkennen van tekst. Het is mogelijk dat het programma moeite heeft met het herkennen van tekens met ongebruikelijke elementen (zoals codenummers), omdat de documenttaal deze tekens niet bevat. Om dergelijke documenten toch te herkennen, kunt u een aangepaste taal maken met alle benodigde tekens. U kunt ook meerdere talen aan taalgroepen toewijzen en deze groepen gebruiken voor de herkenning.

Een gebruikerstaal maken

  1. Klik in het menu Extra op Taleneditor….
  2. In het dialoogvenster Taleneditor klikt u op Nieuw….
  3. In het dialoogvenster dat verschijnt, selecteert u de optie Een nieuwe taal maken op basis van een bestaande en vervolgens de taak die wordt gebruikt als de basis van uw nieuwe taal. Klik dan op OK.
  4. Het dialoogvenster Taaleigenschappen wordt nu weergegeven. In dit dialoogvenster:
    1. typt u de naam van de nieuwe taal.
    2. De eerder geselecteerde basistaal wordt weergegeven in de vervolgkeuzelijst Brontaal. U kunt de brontaal veranderen.
    3. Het Alfabet bevat het alfabet van de basistaal. Klik op de knop als u het alfabet wilt aanpassen.
    4. Er zijn diverse opties met betrekking tot het Woordenboek die door het programma worden gebruikt voor het herkennen van de tekst en het controleren van het resultaat:
      • Geen

De taal heeft geen woordenboek.

  • Ingebouwd woordenboek

Het meegeleverde woordenboek wordt gebruikt.

  • Gebruikerswoordenboek

Klik op de knop Bewerken… om woordenboektermen op te geven of om een bestaand aangepast woordenboek of een tekstbestand met een Windows-1252-codering te importeren (termen moeten zijn gescheiden door spaties of tekens die niet in het alfabet voorkomen).

Opmerking: Woorden uit het gebruikerswoordenboek worden niet gemarkeerd als foutief tijdens de spellingcontrole van de herkende tekst. Ze mogen geheel met kleine letters of hoofdletters worden geschreven of alleen beginnen met een hoofdletter.

Woord in het woordenboek Woorden die niet als foutief worden beschouwd tijdens een spellingcontrole
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
  • Reguliere expressie

U kunt woordenboeken met een aangepaste taal maken door reguliere expressies te gebruiken.

Zie voor meer informatie "Reguliere expressies."

  1. Talen kunnen verschillende extra eigenschappen hebben. Om deze eigenschappen aan te passen, klikt u op de knop Geavanceerd….

Het dialoogvenster Geavanceerde taaleigenschappen wordt nu weergegeven. Hier kunt u het volgende specificeren:

  • Tekens die aan het begin of eind van een woord kunnen staan
  • Tekens die geen letters zijn die op zichzelf mogen voorkomen
  • Tekens die in het midden van een woord voorkomen en die moeten worden genegeerd
  • Tekens die volgens dit woordenboek niet in de herkende tekst kunnen voorkomen (verboden tekens)
  • Alle herkenbare tekens van de taal
  • U kunt ook de optie Tekst kan Arabische cijfers, Romeinse cijfers en afkortingen bevatten inschakelen
  1. U kunt nu de nieuw gemaakte taal kiezen als documenttaal.

Zie "Functies van het document vaststellen voorafgaand aan OCR" voor meer informatie over documenttalen.

Standaard wordt de gebruikerstaal opgeslagen in de documentenmap van FineReader. U kunt ook alle gebruikerstalen en gebruikerspatronen opslaan als een enkel bestand. Klik daarvoor in het menu Extra op Opties… om het dialoogvenster Opties te openen. Klik op het tabblad Lezen en vervolgens op de knop Opslaan naar bestand....

Een taalgroep maken

Als u een bepaalde combinatie van talen regelmatig denkt te gaan gebruiken, kunt u de talen voor het gemak in taalgroepen indelen.

  1. Klik in het menu Extra op Taleneditor….
  2. In het dialoogvenster Taleneditor klikt u op Nieuw….
  3. In het dialoogvenster Nieuwe taal of groep dat nu wordt geopend, selecteert u Een nieuwe taalgroep maken en vervolgens klikt u op OK.
  4. Het dialoogvenster Taalgroepeigenschappen wordt weergegeven. Typ een naam voor de nieuwe groep en selecteer de gewenste talen.

Opmerking: Als u weet dat bepaalde tekens niet in uw tekst zullen voorkomen, kunt u deze zogeheten verboden tekens expliciet specificeren. Het definiëren van verboden tekens kan zowel de snelheid als de kwaliteit van de herkenning ten goede komen. Om verboden tekens te specificeren, klikt u op de knop Geavanceerd… in het dialoogvenster Taalgroepeigenschappen. In het dialoogvenster In het dialoogvenster Geavanceerde taalgroepeigenschappen typt u de verboden tekens in het veld Verboden tekens.

  1. Klik op OK.

De nieuwe groep wordt toegevoegd aan de vervolgkeuzelijst Documenttaal op de hoofdwerkbalk.

De standaardinstelling is dat taalgroepen worden opgeslagen in de documentenmap van FineReader. U kunt ook alle gebruikerstalen en gebruikerspatronen opslaan als een enkel bestand. Klik daarvoor in het menu Extra op Opties… om het dialoogvenster Opties te openen, klik op het tabblad Lezen en vervolgens op de knop Opslaan naar bestand….

Tip: Als u voor een document een bepaalde talencombinatie nodig hebt, kunt u de betreffende talen ook rechtstreeks selecteren zonder eerst een taalgroep te definiëren.

  1. Selecteer in de vervolgkeuzelijst Documenttaal de optie Meer talen…
  2. In het dialoogvenster Taleneditor selecteert u Talen handmatig opgeven.
  3. Selecteer de gewenste talen en klik op Annuleren.

1/14/2020 5:26:20 PM


Please leave your feedback about this article