Arbejde med komplekse scriptsprog

Download

Med ABBYY FineReader kan du genkende dokumenter på arabisk, hebraisk, jiddisch, thai, kinesisk, japansk og koreansk. Nogle yderligere overvejelser skal tages i betragtning, når du arbejder med dokumenter på kinesisk, japansk eller koreansk og dokumenter, hvor en kombination af CJK og europæiske sprog bruges.

Installation af sprogstøtte

For at kunne genkende tekster skrevet på arabisk, hebraisk, jiddisch, thai, kinesisk, japansk og koreansk skal du muligvis installere disse sprog.

Microsoft Windows 8, Windows 7, og Windows Vista understøtter disse sprog som standard.

Sådan installeres nye sprog i Microsoft Windows XP:

  1. Klik på Start på proceslinjen.
  2. Klik på Kontrolpanel > Internationale og sproglige indstillinger.
  3. Klik på fanen Sprog og vælge følgende indstillinger:
    • Installér filer til komplekst script og højre-til-venstre sprog (inklusive thai)

for at understøtte arabisk, hebraisk, jiddisch og thai

  • Installér filer for østasiatiske sprog

for at understøtte japansk, kinesisk og koreansk

  1. Klik på OK.

Anbefalede skrifttyper

Genkendelse af tekst på arabisk, hebraisk, jiddisch, thai, kinesisk, japansk og koreansk kan kræve installation af ekstra skrifttyper i Windows. Nedenstående tabel angiver de anbefalede skrifttyper for tekster på disse sprog.

OCR-sprog Anbefalet skrifttype
Arabisk Arial™ Unicode™ MS*
Hebraisk Arial™ Unicode™ MS*
Yiddish Arial™ Unicode™ MS*
Thai

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Kinesisk (forenklet),

kinesisk (traditionelt),

japansk, koreansk,

koreansk (hangul)

Arial™ Unicode™ MS*

SimSun fonts

såsom: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(for-ISO10646)

STSong

* Denne skrifttype installeres sammen med Microsoft Windows XP og Microsoft Office 2000 eller nyere.

Afsnittene nedenfor indeholder råd om at forbedre genkendelsens nøjagtighed.

Deaktivering af automatisk behandling

Som standard genkendes alle sider du føjer til et ABBYY FineReader-dokument automatisk.

Hvis dokumentet indeholder en tekst i et CJK-sprog kombineret med et europæisk sprog, anbefaler vi at deaktivere automatisk registrering af sideretning og kun at bruge indstillingen til opdeling af dobbeltsider, hvis alle sidebillederne har korrekt retning (dvs. de er ikke scannet oppefra og ned).

Indstillingerne Bestem sideretning og Opdel modstående sider kan blive aktiveret og deaktiveret på Scan/Åbn i dialogboksen Muligheder.

Bemærk: For at opdele modstående sider på arabisk, hebraisk eller jiddisch, skal du sørge for at vælge det tilsvarende genkendelsessprog først og først derefter vælge indstillingen Opdel modstående sider. Dette vil sikre, at siderne er arrangeret i den rigtige rækkefølge. Du kan også gendanne den originale sidenummereringen ved at vælge muligheden Udskift bogsider. For yderligere oplysninger, se "Hvad er et FineReader-dokument?"

Hvis dokumentet har en kompleks struktur, anbefaler vi at deaktivere automatisk analyse og OCR til billeder og udføre disse handlinger manuelt.

Sådan deaktiveres automatisk analyse og OCR:

  1. Åbn dialogboksen Muligheder (Funktioner > Indstillinger…).
  2. Ryd indstillingen Behandl sider automatisk, efterhånden som de tilføjesScan/Åbn.
  3. Klik på OK.

Genkendelse af dokumenter, der er skrevet i mere end et sprog

I vejledningen nedenfor er et dokument, der indeholder både engelsk og kinesisk tekst som et eksempel.

  1. På hovedværktøjslinjen skal du klikker på Flere sprog… fra rullelisten Dokumentsprog. Vælg Angiv sprog manuelt fra dialogboksen Sprogredigering og vælg kinesisk og engelsk fra sproglisten.
  2. Scan eller åbn billederne.
  3. Hvis programmet ikke kan finde alle områderne på et billede:
    • Angive områder manuelt ved hjælp af redigeringsværktøjer.
    • Angiv de områder, som kun indeholder ét sprog. Dette gøres ved at vælge dem og angive deres sprog i ruden Egenskaber for område.

Vigtigt! Du kan kun angive ét sprog til områder af samme type. Hvis du valgte områder af forskellige typer, som f. eks.Tekst og Tabel, vil du ikke være i stand til at angive et sprog.

  1. Klik på knappen Læs på hovedværktøjslinjen.

Ikke-europæiske tegn vises ikke i vinduet Tekst

Hvis en tekst i en CJK-sprog vises forkert i vinduet Tekst, kan du have valgt Almindelig tekst.

Sådan ændres den anvendte skrifttype i tilstanden Almindelig tekst:

  1. Åbn dialogboksen Muligheder (Funktioner > Indstillinger…).
  2. Klik på fanen Vis.
  3. Vælg Arial Unicode MS fra rullelisten Skrifttype brugt til at vise almindelig tekst rulleliste.
  4. Klik på OK.

Hvis dette ikke hjælper og tekst i vinduet Tekst stadig vises forkert, så se "Hvis nogle tegn er erstattet med "?" eller "□" i tekstvinduet."

Valg af retning af genkendt tekst

ABBYY FineReader registrerer tekstretning automatisk, men du kan også angive retningen manuelt.

  1. Vælg en eller flere paragraffer i vinduet Tekst.
  2. Klik på knappen på værktøjslinjen i vinduet Tekst.

Bemærk: Du kan bruge rullelisten Retning for CJK-tekst i vinduet Billede til at angive retningen for tekst forud for genkendelse. Se Hvis den lodrette eller inverteret tekst ikke genkendes korrekt for yderligere oplysninger.

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.