Werken met complex-script talen

Download

Met ABBYY FineReader kunt u ook documenten herkennen in het Arabisch, Hebreeuws, Jiddisch, Thai, Chinees, Japans en Koreaans. Er zijn wel enkele dingen waarmee u rekening moet houden als u werkt met documenten in het Chinees, Japans of Koreaans en documenten met een combinatie van deze CJK-talen en Europese talen.

Taalondersteuning installeren

Om teksten te herkennen die in het Arabisch, Hebreeuws, Jiddisch, Thai, Chinees, Japans en Koreaans zijn geschreven, kan het nodig zijn om deze talen afzonderlijk te installeren.

Microsoft Windows 8 en Windows 7 en Windows Vista ondersteunen deze talen standaard.

Om nieuwe talen onder Microsoft Windows XP te installeren:

  1. Klik op Start in de taakbalk.
  2. Klik op Configuratiescherm > Landinstellingen.
  3. Klik op het tabblad Talenen selecteer de volgende opties:
    • Bestanden installeren voor complexe schriftsystemen en talen die van rechts naar links geschreven worden (inclusief Thai)

voor ondersteuning voor Arabisch, Hebreeuws, Jiddisch en Thai

  • Bestanden voor Oost-Aziatische talen installeren

voor ondersteuning voor Japans, Chinees en Koreaans.

  1. Klik op OK.

Aanbevolen lettertypen

Voor de herkenning van teksten in het Arabisch, Hebreeuws, Jiddisch, Thai, Chinees, Japans en Koreaans moet u mogelijk extra lettertypen installeren in Windows. In onderstaande tabel vindt u de aanbevolen lettertypen voor teksten in deze talen.

OCR-taal Aanbevolen lettertype
Arabisch Arial™ Unicode™ MS*
Hebreeuws Arial™ Unicode™ MS*
Jiddisch Arial™ Unicode™ MS*
Thai

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Chinees (vereenvoudigd),

Chinees (traditioneel),

Japans, Koreaans

, Koreaans (Hangul)

Arial™ Unicode™ MS*

SimSun-lettertype

zoals: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(voor-ISO10646)

STSong

* Dit lettertype wordt met Microsoft Windows XP en Microsoft Office 2000 of later geïnstalleerd.

In onderstaande secties vindt u tips voor het verbeteren van de nauwkeurigheid van de herkenning.

Automatische verwerking uitschakelen

Standaard worden alle pagina’s die u aan een ABBYY FineReader-document toevoegt automatisch herkend.

Echter, als uw document tekst in een CJK-taal gecombineerd met een Europese taal bevat, bevelen we aan om automatische paginastand-bepaling uit te schakelen en om de optie Dubbele pagina’s splitsen uitsluitend te gebruiken als de pagina-afbeeldingen de juiste oriëntatie hebben (nl. niet ondersteboven gescand).

De opties Paginastand bepalen en Linker- en rechterpagina's splitsen kunnen worden in- en uitgeschakeld op het tabblad Scannen/Openen van het dialoogvenster Opties.

Opmerking: Om tegenoverliggende pagina's in het Arabisch, Hebreeuws of Jiddish te splitsen, moet u eerst de overeenkomstige herkenningstaal instellen en pas daarna de optie Linker- en rechterpagina's splitsen selecteren. Dit zal ervoor zorgen dat de pagina's in de juiste volgorde worden gesorteerd. U kunt de oorspronkelijke paginanummering ook herstellen door de optie Pagina's in boek wisselen te selecteren. Zie voor meer informatie "Wat is een FineReader-document?"

Als uw document een complexe indeling heeft, raden we aan de automatische analyse en OCR voor afbeeldingen uit te schakelen en deze handelingen handmatig te verrichten.

Automatische analyse en OCR uitschakelen:

  1. Open het dialoogvenster Opties (Extra> Opties…).
  2. Schakel de optie Automatisch pagina's verwerken nadat ze zijn toegevoegd uit op het tabblad Scannen/Openen.
  3. Klik op OK.

Meertalige documenten herkennen

In de volgende instructies wordt gebruikgemaakt van een document dat zowel Engelse als Chinese tekst bevat.

  1. In de hoofdwerkbalk selecteert u Meer talen… in de vervolgkeuzelijst Documenttalen. Selecteer Talen handmatig opgeven in het dialoogvenster Taleneditor en kies Chinees en Engels in de talenlijst.
  2. Scan of open de afbeeldingen.
  3. Als het programma niet alle gebieden van een afbeelding herkent:
    • Specificeer gebieden handmatig met de hulpmiddelen voor het bewerken van gebieden.
    • Specificeer alle gebieden die slechts één taal bevatten. Daartoe selecteert u ze en geeft u de taal op in het deelvenster Gebiedseigenschappen.

Belangrijk! U kunt alleen voor gebieden van hetzelfde type een taal opgeven. Als u gebieden van andere typen heeft geselecteerd, zoals Tekst en Tabel, kunt u geen taal opgeven.

  1. Klik op de knop Lezen in de hoofdwerkbalk.

Als niet-Europese tekens niet in het venster Tekst worden weergegeven

Als tekst in een CJK-taak onjuist wordt weergegeven in het venster Tekst moet u wellicht de modus Niet-opgemaakte tekst kiezen.

U kunt het lettertype in de modus Niet-opgemaakte tekst als volgt wijzigen:

  1. Open het dialoogvenster Opties (Extra> Opties…).
  2. Klik op het tabblad Beeld.
  3. Selecteer Arial Unicode MS in de vervolgkeuzelijst Lettertype voor platte tekst.
  4. Klik op OK.

Als dit niet helpt en de tekst in het venster Tekst nog steeds onjuist wordt weergegeven, raadpleegt u "Als bepaalde tekens worden vervangen door "?" of "□"."

De richting van herkende tekst wijzigen

ABBYY FineReader herkent de tekstrichting automatisch, maar u kunt de tekstrichting ook handmatig instellen.

  1. Selecteer een of meer paragrafen in het venster Tekst.
  2. Klik op de knop op de werkbalk van het venster Tekst.

Opmerking: U kunt de vervolgkeuzelijst CJK tekstrichting in het venster Afbeelding gebruiken om de tekstrichting nog voor de herkenning in te stellen. Zie voor meer informatie Als verticale of omgekeerde tekst niet wordt herkend.

14.01.2020 17:26:20

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.