Functies van het document vaststellen voorafgaand aan OCR

Download

De kwaliteit van OCR is in grote mate afhankelijk van de kwaliteit van de afbeelding. In dit gedeelte wordt uitgelegd met welke factoren u rekening moet houden voordat u begint met het herkennen van afbeeldingen.

OCR-talen

ABBYY FineReader kan zowel enkeltalige als meertalige documenten (bijv. geschreven in twee talen) herkennen. Bij meertalige documenten moet u meerdere OCR-talen instellen.

Om OCR-talen te selecteren, klikt u op Opties >  Talen en selecteert u een van de volgende opties:

  • Automatisch OCR-talen selecteren in de onderstaande lijst
    ABBYY FineReader selecteert automatisch de juiste talen uit de door de gebruiker ingestelde lijst met talen. Zo bewerkt u de lijst met talen:
    1. Zorg ervoor dat de Automatisch OCR-talen selecteren in de onderstaande lijst optie is geselecteerd.
    2. Klik op de Opgeven... knop.
    3. In het Talen dialoogvenster selecteert u de gewenste talen en klikt u op OK.
    4. In het Opties dialoogvenster. Klik op OK.
  • Handmatig OCR-talen specificeren
    Selecteer deze optie als de taal niet in de lijst voorkomt.

In het onderstaande dialoogvenster geeft u een of meer talen op. Als u een bepaalde talencombinatie vaak gebruikt, kunt u een nieuwe groep maken voor deze talen.

Als een taal niet voorkomt in de lijst, wordt de taal:

  1. Niet ondersteund door ABBYY FineReader, of
    Ga voor een lijst met alle ondersteunde talen naar Ondersteunde OCR-talen.
  2. Niet ondersteund door uw versie van het product.
    U vindt de volledige lijst van talen die beschikbaar zijn in uw versie van het product in het Licenties- dialoogvenster (klik op Help > Info over... > Licentie-info om dit dialoogvenster te openen).

Behalve ingebouwde talen en taalgroepen kunt u ook zelf talen en groepen maken. Zie ook: Als het programma niet alle tekens herkent.

Afdruktype

Documenten kunnen zijn gemaakt met verschillende apparaten, zoals schrijfmachines en faxapparaten. De OCR-kwaliteit is afhankelijk van de manier waarop een document is afgedrukt. U kunt de OCR-kwaliteit verbeteren door het selecteren van het juiste afdruktype in het Opties dialoogvenster.

Voor de meeste documenten wordt het afdruktype automatisch herkend. Voor automatische herkenning van het afdruktype moet de Automatisch optie zijn geselecteerd in de Documenttype optiegroep in het Opties dialoogvenster (klik op Gereedschappen > Opties... > OCR voor toegang tot deze opties). U kunt documenten verwerken in volledig kleur of in zwart-witmodus.

U kunt ook handmatig het gewenste afdruktype selecteren.

Een voorbeeld van getypte tekst. Alle letters zijn even breed (vergelijk bijvoorbeeld w en t). Voor teksten van dit type selecteert u Typemachine.
Een voorbeeld van een tekst die is geproduceerd door een faxapparaat. Zoals u kunt zien in het voorbeeld, zijn de letters niet overal even duidelijk. Er is ook wat ruis en vervorming. Voor teksten van dit type selecteert u Fax.

Na het herkennen van getypte teksten of faxen selecteert u Automatisch voor de verwerking van regelmatig afgedrukte documenten.

Afdrukkwaliteit

Documenten van slechte kwaliteit met ruis (willekeurig verspreide zwarte punten of spikkeltjes), vervormde en onregelmatige letters of scheve regels en verschoven tabelranden, kunnen specifieke scaninstellingen vereisen.

Fax Krant

Documenten van slechte kwaliteit kunt u het beste scannen in grijswaarden. Tijdens het scannen in grijswaarden wordt automatisch de juiste helderheid- waarde ingesteld.

In de scanmodus Grijswaarden blijft er meer informatie over de letters in de gescande tekst bewaard, waardoor er betere OCR-resultaten behaald kunnen worden bij de herkenning van documenten van matige of slechte kwaliteit. U kunt ook defecten handmatig corrigeren met behulp van de bewerkingsgereedschappen voor afbeeldingen in de Afbeeldingseditor. Zie ook: Als uw documentafbeelding fouten bevat en de OCR-nauwkeurigheid laag is.

Kleurmodus

Als u de oorspronkelijke kleuren van een document in kleurenmodus niet hoeft te behouden, kunt u het document verwerken in zwart-witmodus. Hierdoor wordt de grootte van het resulterende OCR-project aanzienlijk verkleind en het OCR-proces versneld. De verwerking van afbeeldingen met laag contrast naar zwart-wit kan echter tot slechte OCR-kwaliteit leiden. We raden de zwart-witverwerking af voor foto’s, pagina’s uit een tijdschrift en teksten in het Chinees, Japans en Koreaans.

Tip. U kunt de OCR van documenten in kleur en zwart-wit versnellen door het selecteren van Snelle herkenning op het OCR tabblad van het Opties dialoogvenster. Voor meer informatie over de herkenningsmodi, zie OCR-opties.

Voor extra tips over het selecteren van de juiste kleurmodus, zie Scantips.

Als het document geconverteerd is naar zwart-wit, kunt u de kleuren niet meer herstellen. Om een kleurendocument te verkrijgen, opent u het bestand met kleurenafbeeldingen of scant u het papieren document in kleurmodus.

04.03.2022 7:13:23

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.