Dokumentfunktioner at overveje før OCR udføres

Download

Kvaliteten af billeder har en betydelig indvirkning på genkendelseskvaliteten. Dette afsnit beskriver, hvilke forhold du skal tage højde for, før du genkender billeder:

Dokumentsprog

ABBYY FineReader genkender både setsprogede og flersprogede dokumenter (f. eks. skrevet på to eller flere sprog). For flersprogede dokumenter, skal du vælge flere genkendelsessprog.

Hvis du vil angive et OCR-sprog for dit dokument, skal du i rullelisten Dokumentsprog på hovedværktøjslinjen eller i Opgave vælge én af følgende:

  • Automatisk valg

ABBYY FineReader vælger automatisk de relevante sprog fra den brugerdefinerede liste med sprog. Sådan ændres denne liste:

  1. Vælg Flere sprog…
  2. I dialogboksen Sprogredigering, skal du vælge indstillingen Vælg dokumentsprog automatisk fra følgende liste.
  3. Klik på knappen Angiv….
  4. I dialogboksen Sprog skal du vælge de ønskede sprog.
  • Et sprog eller en sprogkombination

Vælg et sprog eller en sprogkombination. Listen med sprog omfatter de seneste anvendte genkendelsessprog samt engelsk, tysk og fransk.

  • Flere sprog…

Vælg denne indstilling, hvis det ønskede sprog ikke vises på listen.

I dialogboksen Sprogredigering skal du vælge indstillingen Angiv sprog manuelt og derefter vælge det eller de ønskede sprog ved at markere de relevante felter. Hvis du ofte bruger en bestemt sprogkombination, kan du oprette en ny gruppe til disse sprog.

Hvis et sprog ikke er på listen, er det enten:

  1. Dette sproget understøttes ikke af ABBYY FineReader.

For en komplet liste over understøttede sprog, se "Understøttede sprog."

  1. Disse sprog er ikke understøttet af din version af softwaren.

Den fuldstændige liste over tilgængelige sprog i din kopi kan findes i dialogboksen Licenser (Hjælp > Om… > Licensoplysninger).

Ud over at bruge indbyggede sprog og sproggrupper, kan du oprette din egne. For detaljer, se "Hvis programmet ikke kan genkende nogle af tegnene."

Udskrifts-type

Dokumenter kan udskrives på forskellige enheder, f. eks. skrivemaskiner og faxmaskine. OCR-kvalitet kan forbedres ved at vælge den korrekte Dokumenttype i dialogboksen Muligheder.

Til de fleste dokumenter registrerer programmet automatisk udskrivningstypen. For automatisk registrering af udskrivningstype skal indstillingen Auto vælges under Dokumenttype i dialogboksen Muligheder (Funktioner > Indstillinger…). Du kan behandle dokumentet i fuld farve eller sort-hvid tilstand.

Du kan også vælge udskrivningstypen manuelt efter behov.

Et eksempel på maskinskreven tekst. Alle bogstaver har samme bredde (sammenlign f.eks. "w" og "t"). For tekster af denne type skal du vælge Skrivemaskine.
Eksempel på tekst fra en faxmaskine. Som det ses i eksemplet, er bogstaverne uklare nogle steder og udsat for støj og forvrængning. For tekster af denne type skal du vælge Fax.

Tip: Efter genkendelse af maskinskreven tekst eller fax skal du sørge for at vælge Auto før behandling af almindelige udskrevne dokumenter.

Udskrivningskvalitet

Dokumenter i dårlig kvalitet med "støj" (f.eks. tilfældige sorte prikker eller pletter), slørede eller ujævne bogstaver eller skæve linjer og forskudte tabelkanter kan kræve specifikke scanningsindstillinger.

Fax Avis

Dokumenter i dårlig kvalitet scannes bedst i gråtoner. Ved scanning i gråtoner vælger programmet automatisk den optimale lysstyrke.

Gråtone-skanningstilstanden indeholder flere oplysninger om bogstaver i den skannede tekst for at opnå bedre OCR-resultater ved genkendelse af dokumenter i mellem til dårlig kvalitet. Du kan også rette nogle af fejlene manuelt ved hjælp af billedredigeringsværktøjet, som er til rådighed i Billedredigering. For yderligere oplysninger, se "Forbehandling af billede."

Farvetilstand

Hvis du ikke har brug for at bevare de originale farver, der anvendes i et fuld-farvedokument, kan du behandle dokumentet i sort-hvid tilstand. Dette vil i høj grad reducere størrelsen af ​​det resulterende ABBYY FineReader-dokument og fremskynder OCR-processen. Men behandling af billeder med lav kontrast i sort og hvidt kan resultere i dårlig OCR-kvalitet. Vi anbefaler ikke sort og hvid forarbejdning til fotos, magasinsider og tekster på kinesisk, japansk og koreansk.

Bemærk: Du kan også fremskynde genkendelse af farve- og sort/hvid-dokumenter ved at vælge indstillingen Hurtig læsningLæs-fanen i dialogboksen Muligheder. For mere om genkendelsestilstande, se OCR-indstillinger.

Sådan vælges en farvetilstand:

  • Brug rullelisten Farve-tilstand i dialogboksen Opgave eller
  • Vælg en af indstillingerne under Farvetilstand på fanen Dokument i dialogboksen Muligheder (Funktioner > Indstillinger…).

Vigtigt! Når dokumentet er konverteret til sort-hvid, vil du ikke være i stand til at gendanne farverne. For at få et farvedokument, skal du åbne filen med farvebilleder eller skanne papirdokumentet i farvetilstand.

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.