Functies van het document vaststellen voorafgaand aan OCR

Download

De kwaliteit van de herkenning is in grote mate afhankelijk van de kwaliteit van de afbeelding. In dit gedeelte wordt uitgelegd met welke factoren u rekening moet houden voordat u begint met het herkennen van afbeeldingen:

Documenttalen

ABBYY FineReader kan zowel enkeltalige als meertalige documenten (bijv. geschreven in twee talen) herkennen. Bij meertalige documenten moet u meerdere herkenningstalen instellen.

Om een OCR-taal voor uw document in te stellen, selecteert u in de vervolgkeuzelijst Documenttaal op de hoofdwerkbalk of in het venster Taak een van de volgende opties:

  • Automatisch selecteren

ABBYY FineReader selecteert automatisch de juiste talen uit de, door de gebruiker ingestelde, lijst met talen. U kunt deze lijst als volgt wijzigen:

  1. Selecteer Meer talen…
  2. In het dialoogvenster Taleneditor, selecteert u de optie Automatisch documenttalen selecteren in de onderstaande lijst.
  3. Klik op de knop Opgeven….
  4. In het dialoogvenster Talen selecteert u de gewenste talen.
  • Eén taal of een talencombinatie

Selecteer één taal of een talencombinatie. De lijst met talen bevat de recentelijk gebruikte talen en Engels, Duits en Frans.

  • Meer talen…

Selecteer deze optie als de gewenste taal niet in de lijst voorkomt.

In het dialoogvenster Taleneditor selecteert u de optie Talen handmatig opgeven en vervolgens selecteert u de gewenste taal of talen door de bijbehorende selectievakjes in te schakelen. Als u een bepaalde talencombinatie vaak gebruikt, kunt u voor deze talen een nieuwe groep definiëren.

Als een taal niet voorkomt in de lijst, wordt de taal:

  1. niet ondersteund door ABBYY FineReader.

Ga voor een lijst met alle ondersteunde talen naar "Ondersteunde talen."

  1. niet ondersteund door de versie van uw software.

De volledige lijst met talen die beschikbaar zijn in uw exemplaar kunt u vinden in het dialoogvenster Licenties (Help > Over… > Licentie-info).

Behalve ingebouwde talen en taalgroepen kunt u ook zelf talen maken en gebruiken. Ga voor meer informatie naar "Als het programma niet alle tekens herkent."

Afdruktype

Documenten kunnen zijn gemaakt met verschillende apparaten, zoals schrijfmachines en faxapparaten. U kunt de OCR-kwaliteit verbeteren door het juiste Documenttype te selecteren in het dialoogvenster Opties.

Bij de meeste documenten zal het programma het afdruktype zelf automatisch detecteren. Hiervoor is nodig dat de optie Auto is geselecteerd bij Documenttype in het dialoogvenster Opties (Extra> Opties…). U kunt het document verwerken in volledige kleur of in zwart-witmodus.

U kunt er ook voor kiezen het gewenste afdruktype handmatig in te stellen.

Een voorbeeld van een tekst die met een typemachine is gemaakt. Alle letters zijn even breed (vergelijk bijvoorbeeld "w" en "t"). Selecteer de optie Typemachine (alleen zwart-wit modus) voor teksten van dit type.
Een voorbeeld van een tekst die door een fax is gemaakt. Zoals u kunt zien, zijn de letters op sommige plaatsen niet duidelijk, daarnaast komen ook ruis en vervorming voor. Selecteer de optie Fax (alleen zwart-wit modus) voor teksten van dit type.

Tip: na de herkenning van teksten of faxberichten die met een schrijfmachine zijn geschreven, dient u Auto te selecteren voordat u op normale wijze gedrukte documenten verwerkt.

Printkwaliteit

Documenten van slechte kwaliteit met "ruis" (willekeurig verspreide zwarte punten of spikkeltjes), vervormde en onregelmatige letters of scheve regels en verschoven tabelranden, kunnen specifieke scaninstellingen vereisen.

Fax Krant

Documenten van slechte kwaliteit kunt u het beste in grijswaarden scannen. Tijdens het scannen in grijswaarden wordt automatisch de juiste helderheid ingesteld.

In de scanmodus Grijswaarden blijft er meer informatie over de letters in de gescande tekst bewaard, waardoor er betere OCR-resultaten behaald kunnen worden bij de herkenning van documenten van matige of slechte kwaliteit. U kunt ook defecten handmatig corrigeren met behulp van de bewerkingsgereedschappen voor afbeeldingen in de Afbeeldingseditor. Zie Afbeeldingen voorbewerken voor meer informatie.

Kleurmodus

Als u de oorspronkelijke kleuren van een document  niet hoeft te behouden, kunt u het document verwerken in zwart-wit. Hierdoor wordt de grootte van het resulterende ABBYY FineReader-document aanzienlijk verkleind en het OCR-proces versneld. De verwerking van afbeeldingen met laag contrast naar zwart-wit kan echter leiden tot slechte OCR-kwaliteit. We raden de zwart-witverwerking af voor foto’s, pagina’s uit een tijdschrift en teksten in het Chinees, Japans en Koreaans.

Opmerking: U kunt de herkenning van documenten in kleur en zwart-wit versnellen door de optie Snel lezen in te schakelen op het tabblad Lezen van het dialoogvenster Opties. Zie OCR-opties voor meer herkenningsmodi.

Een kleurenmodus selecteren:

  • Gebruik de vervolgkeuzelijst Kleurmodus in het dialoogvenster Taak of
  • Gebruik de opties onder Kleurmodus op het tabblad Document van het dialoogvenster Opties (Extra > Opties…).

Belangrijk! Als het document geconverteerd is naar zwart-wit, kunt u de kleuren niet meer herstellen. Om een kleurendocument te verkrijgen, opent u het bestand met kleurenafbeeldingen of scant u het papieren document in kleurmodus.

14.01.2020 17:26:20

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.