- English (English)
- Bulgarian (Български)
- Chinese Simplified (简体中文)
- Chinese Traditional (繁體中文)
- Czech (Čeština)
- Dutch (Nederlands)
- Estonian (Eesti)
- French (Français)
- German (Deutsch)
- Greek (Ελληνικά)
- Hungarian (Magyar)
- Italian (Italiano)
- Japanese (日本語)
- Korean (한국어)
- Polish (Polski)
- Portuguese (Brazilian) (Português (Brasil))
- Slovak (Slovenský)
- Spanish (Español)
- Swedish (Svenska)
- Turkish (Türkçe)
- Ukrainian (Українська)
- Vietnamese (Tiếng Việt)
Arbejde med komplekse scriptsprog
Med ABBYY FineReader kan du genkende dokumenter på arabisk, hebraisk, jiddisch, thai, kinesisk, japansk og koreansk. Nogle yderligere overvejelser skal tages i betragtning, når du arbejder med dokumenter på kinesisk, japansk eller koreansk og dokumenter, hvor en kombination af CJK og europæiske sprog bruges.
- Installation af sprogstøtte
- Anbefalede skrifttyper
- Deaktivering af automatisk billedbehandling
- Genkendelse af dokumenter, der er skrevet i mere end et sprog
- Ikke-europæiske tegn vises ikke i vinduet Tekst
- Valg af retning af genkendt tekst
Installation af sprogstøtte
For at kunne genkende tekster skrevet på arabisk, hebraisk, jiddisch, thai, kinesisk, japansk og koreansk skal du muligvis installere disse sprog.
Microsoft Windows 8, Windows 7, og Windows Vista understøtter disse sprog som standard.
Sådan installeres nye sprog i Microsoft Windows XP:
- Klik på Start på proceslinjen.
- Klik på Kontrolpanel > Internationale og sproglige indstillinger.
- Klik på fanen Sprog og vælge følgende indstillinger:
- Installér filer til komplekst script og højre-til-venstre sprog (inklusive thai)
for at understøtte arabisk, hebraisk, jiddisch og thai
- Installér filer for østasiatiske sprog
for at understøtte japansk, kinesisk og koreansk
- Klik på OK.
Anbefalede skrifttyper
Genkendelse af tekst på arabisk, hebraisk, jiddisch, thai, kinesisk, japansk og koreansk kan kræve installation af ekstra skrifttyper i Windows. Nedenstående tabel angiver de anbefalede skrifttyper for tekster på disse sprog.
OCR-sprog | Anbefalet skrifttype |
Arabisk | Arial™ Unicode™ MS* |
Hebraisk | Arial™ Unicode™ MS* |
Yiddish | Arial™ Unicode™ MS* |
Thai |
Arial™ Unicode™ MS* Aharoni David Levenim mt Miriam Narkisim Rod |
Kinesisk (forenklet), kinesisk (traditionelt), japansk, koreansk, koreansk (hangul)
|
Arial™ Unicode™ MS* SimSun fonts såsom: SimSun (Founder Extended), SimSun-18030, NSimSun. Simhei YouYuan PMingLiU MingLiU Ming(for-ISO10646) STSong |
* Denne skrifttype installeres sammen med Microsoft Windows XP og Microsoft Office 2000 eller nyere.
Afsnittene nedenfor indeholder råd om at forbedre genkendelsens nøjagtighed.
Deaktivering af automatisk behandling
Som standard genkendes alle sider du føjer til et ABBYY FineReader-dokument automatisk.
Hvis dokumentet indeholder en tekst i et CJK-sprog kombineret med et europæisk sprog, anbefaler vi at deaktivere automatisk registrering af sideretning og kun at bruge indstillingen til opdeling af dobbeltsider, hvis alle sidebillederne har korrekt retning (dvs. de er ikke scannet oppefra og ned).
Indstillingerne Bestem sideretning og Opdel modstående sider kan blive aktiveret og deaktiveret på Scan/Åbn i dialogboksen Muligheder.
Bemærk: For at opdele modstående sider på arabisk, hebraisk eller jiddisch, skal du sørge for at vælge det tilsvarende genkendelsessprog først og først derefter vælge indstillingen Opdel modstående sider. Dette vil sikre, at siderne er arrangeret i den rigtige rækkefølge. Du kan også gendanne den originale sidenummereringen ved at vælge muligheden Udskift bogsider. For yderligere oplysninger, se "Hvad er et FineReader-dokument?"
Hvis dokumentet har en kompleks struktur, anbefaler vi at deaktivere automatisk analyse og OCR til billeder og udføre disse handlinger manuelt.
Sådan deaktiveres automatisk analyse og OCR:
- Åbn dialogboksen Muligheder (Funktioner > Indstillinger…).
- Ryd indstillingen Behandl sider automatisk, efterhånden som de tilføjes på Scan/Åbn.
- Klik på OK.
Genkendelse af dokumenter, der er skrevet i mere end et sprog
I vejledningen nedenfor er et dokument, der indeholder både engelsk og kinesisk tekst som et eksempel.
- På hovedværktøjslinjen skal du klikker på Flere sprog… fra rullelisten Dokumentsprog. Vælg Angiv sprog manuelt fra dialogboksen Sprogredigering og vælg kinesisk og engelsk fra sproglisten.
- Scan eller åbn billederne.
- Hvis programmet ikke kan finde alle områderne på et billede:
- Angive områder manuelt ved hjælp af redigeringsværktøjer.
- Angiv de områder, som kun indeholder ét sprog. Dette gøres ved at vælge dem og angive deres sprog i ruden Egenskaber for område.
Vigtigt! Du kan kun angive ét sprog til områder af samme type. Hvis du valgte områder af forskellige typer, som f. eks.Tekst og Tabel, vil du ikke være i stand til at angive et sprog.
- Hvis nødvendigt, vælg tekstretning fra rullelisten Retning (for detaljer, se Hvis den lodrette eller inverterede tekst ikke er genkendt).
- For tekster i CJK-sprog, giver programmet mulighed for at vælge en tekstretning i rullemenuen Retning for CJK-tekst (for detaljer, se Hvis lodret eller inverterede tekst ikke genkendes korrekt).
- Klik på knappen Læs på hovedværktøjslinjen.
Ikke-europæiske tegn vises ikke i vinduet Tekst
Hvis en tekst i en CJK-sprog vises forkert i vinduet Tekst, kan du have valgt Almindelig tekst.
Sådan ændres den anvendte skrifttype i tilstanden Almindelig tekst:
- Åbn dialogboksen Muligheder (Funktioner > Indstillinger…).
- Klik på fanen Vis.
- Vælg Arial Unicode MS fra rullelisten Skrifttype brugt til at vise almindelig tekst rulleliste.
- Klik på OK.
Hvis dette ikke hjælper og tekst i vinduet Tekst stadig vises forkert, så se "Hvis nogle tegn er erstattet med "?" eller "□" i tekstvinduet."
Valg af retning af genkendt tekst
ABBYY FineReader registrerer tekstretning automatisk, men du kan også angive retningen manuelt.
- Vælg en eller flere paragraffer i vinduet Tekst.
- Klik på knappen på værktøjslinjen i vinduet Tekst.
Bemærk: Du kan bruge rullelisten Retning for CJK-tekst i vinduet Billede til at angive retningen for tekst forud for genkendelse. Se Hvis den lodrette eller inverteret tekst ikke genkendes korrekt for yderligere oplysninger.
14.01.2020 17:26:18