Arbeta med komplexa skriptsprak

Med ABBYY FineReader kan du tolka dokument på arabiska, hebreiska, jiddisch, thailändska, kinesiska, japanska och koreanska. Ytterligare betänkligheter måste tas hänsyn till vid arbete med dokument på kinesiska, japanska eller koreanska och dokument i vilka en kombination av CJK och europeiska språk används.

Installerar språkstöd

Om du vill kunna tolka texter skrivna på arabiska, hebreiska, jiddisch, thailändska, kinesiska, japanska och koreanska kan du behöva att installera dessa språk.

I Microsoft Windows 8, Windows 7 och Windows Vista stöds dessa språk som standard.

Så här installerar du nya språk på Microsoft Windows XP:

  1. Klicka på Start på aktivitetsfältet.
  2. Klicka på Kontrollpanelen > Nationella inställningar och språkinställningar.
  3. Klicka på fliken Språk och välj följande alternativ:
    • Installera filer för komplicerade skriftspråk och språk som skrivs från höger till vänster (inklusive thailändska)

för att aktivera stöd för arabiska, hebreiska, jiddisch och thailändska

  • Installera filer för östasiatiska språk

om du vill aktivera stöd för japanska, kinesiska och koreanska

  1. Klicka på OK.

Rekommenderade typsnitt

Tolkning av texter skrivna på arabiska, hebreiska, jiddisch, thailändska, kinesiska, japanska och koreanska kan kräva installation av ytterligare typsnitt i Windows. Den nedanstående tabellen listar de rekommenderade typsnitten för texter i dessa språk.

OCR-språk Rekommenderat typsnitt
Arabiska Arial™ Unicode™ MS*
Hebreiska Arial™ Unicode™ MS*
Jiddisch Arial™ Unicode™ MS*
Thailändska

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Kinesiska (förenklad),

kinesiska (traditionell),

japanska, koreanska,

koreanska (hangul)

Arial™ Unicode™ MS*

SimSun-typsnitt

som exempelvis: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming(for-ISO10646)

STSong

* Det här typsnittet installeras tillsammans med Microsoft Windows XP och Microsoft Office 2000 eller senare versioner.

De nedanstående avsnitten innehåller råd om hur du kan förbättra tolkningsprecisionen.

Inaktiverar automatisk behandling

Som standard tolkas alla sidor som du lägger till i ett ABBYY FineReader-dokument automatiskt.

Om ett dokument innehåller en text på ett CJK-språk kombinerat med ett europeiskt språk, rekommenderas doc att du avaktiverar automatisk identifiering av sidorienteringen och dessutom bara använda alternativet för att dela upp dubbla sidor om sidbilderna har rätt orientering (dvs. inte har lästs in upp och ned).

Alternativen Känn igen sidorientering och Dela motstående sidor kan aktiveras och inaktiveras från fliken Läs in/öppna i dialogrutan Alternativ.

Obs! Om du vill dela upp motstående sidor på arabiska, hebreiska eller jiddisch måste du först ställa in rätt tolkningsspråk innan du markerar alternativet Dela motstående sidor. Det här garanterar att sidorna kommer i rätt ordning. Du kan även återställa den ursprungliga sidnumreringen genom att välja alternativet Byt ut boksidor. Mer information finns i "Vad är ett FineReader-dokument?"

Om dokumentet har en komplex struktur rekommenderas du att inaktivera automatisk analys och OCR för alla bilder och utföra dessa åtgärder manuellt.

Så här inaktiverar du automatisk analys och OCR:

  1. Öppna dialogrutan Alternativ (Verktyg> Alternativ…).
  2. Avmarkera alternativet Bearbeta sidor automatiskt när de läggs till i fliken Läs in/öppna.
  3. Klicka på OK.

Tolkar dokument på mer än ett språk

I instruktionerna nedan har ett dokument som innehåller både engelska och kinesiska tagits med som ett exempel.

  1. Gå till huvudverktygsfältet och klicka på Fler språk… från listrutan Dokumentspråk. Välj Ange språk manuellt i dialogrutan Språkredigeraren och välj kinesiska och engelska från språklistan.
  2. Läs in eller öppna bilderna.
  3. Om programmet inte identifierar alla områden på en bild ska du:
    • Ange områden manuellt med områdesverktyg.
    • Ange alla områden som endast innehåller ett språk. Du gör det här genom att ange deras språk i panelen Områdesegenskaper.

Viktigt! Språket kan endast anges för områden av samma typ. Om du markerade områden av andra typer, som exempelvisText och Tabell kommer du inte att kunna ange ett språk.

  1. Klicka på knappen Läs i huvudverktygsfältet.

Om icke-europeiska tecken inte visas i fönstret Text

Om en text på ett CJK-språk visas felaktigt i fönstret Text har du kanske valt läget Enkel text.

Så här ändrar du ett typsnitt i läget Enkel text:

  1. Öppna dialogrutan Alternativ (Verktyg > Alternativ…).
  2. Klicka på fliken Visa.
  3. Välj Arial Unicode MS från listrutan Teckensnitt som använts för att visa enkel text.
  4. Klicka på OK.

Om det här inte hjälpte och texten i fönstret Text fortfarande visas felaktigt hänvisar vi dig till "Om några tecken har ersatts med "?" eller "□" i fönstret Text."

Ändrar riktningen på tolkad text

ABBYY FineReader identifierar automatiskt textriktningen, men du kan även ange textriktningen manuellt.

  1. Markera ett eller flera stycken i fönstret Text.
  2. Klicka på knappen i verktygsfältet överst i fönstret Text.

Obs! Du kan använda listrutan Riktning för CJK-text i fönstret Bild för att ange textriktningen innan tolkning. Mer information finns i Om lodrät eller inverterad text inte tolkas korrekt.

1/14/2020 5:26:21 PM


Please leave your feedback about this article