Dokumentfunktioner som bør overvejes før OCR

Download

Kvaliteten af billeder har en betydelig indvirkning på OCR-kvalitet. Dette afsnit beskriver, hvilke faktorer du skal tage højde for, før du genkender billeder.

OCR-sprog

ABBYY FineReader kan genkende både etsprogede og flersprogede dokumenter (f.eks. skrevet på to eller flere sprog). For flersprogede dokumenter skal du vælge flere OCR-sprog.

For at vælge OCR-sprog skal du klikke på Indstillinger > Sprog og vælge en af følgende indstillinger:

  • Vælg automatisk OCR-sprog fra følgende liste
    ABBYY FineReader vælger automatisk de relevante sprog fra den brugerdefinerede liste med sprog. Sådan redigeres listen over sprog:
    1. Sørg for at Vælg automatisk OCR-sprog fra følgende liste indstillingen er aktiveret.
    2. Klik på Angiv... knappen.
    3. I Sprog dialogboksen skal du vælge de ønskede sprog og klikke på OK.
    4. I Indstillinger dialogboksen, klik på OK.
  • Angiv OCR-sprog manuelt
    Vælg denne indstilling hvis sproget du behøver ikke findes på listen.

Angiv et eller flere sprog i dialogboksen nedenfor. Hvis du ofte bruger en bestemt sprogkombination, kan du oprette en ny gruppe for disse sprog.

Hvis et sprog ikke er på listen, er det enten:

  1. Ikke understøttet af ABBYY FineReader, eller
    For en komplet liste over understøttede sprog, se Understøttede OCR-sprog.
  2. Ikke understøttet af din version af produktet.
    Den komplette liste over sprog som er tilgængelige i din version af produktet kan findes i Licenser dialogboksen (klik på Hjælp > Om > Licensoplysninger for at åbne denne dialogboks).

Ud over at bruge indbyggede sprog og sproggrupper kan du oprette din egne sprog og grupper. Se også: Hvis programmet ikke kan genkende visse tegn.

Udskrivningstype

Dokumenter kan udskrives med forskellige enheder, som f.eks. skrivemaskiner og faxmaskiner. OCR-kvalitet kan variere afhængigt af, hvordan et dokument blev udskrevet. Du kan forbedre OCR-kvalitet ved at vælge den korrekte printertype i Indstillinger dialogboksen.

For de fleste dokumenter vil programmet registrere deres udskriftstype automatisk. For automatisk registrering af udskriftstype skal Auto indstillingen vælges i Dokumenttype gruppen af indstillinger i Indstillinger dialogboksen (klik på Redskaber > Indstillinger... > OCR for at få adgang til disse indstillinger). Du kan behandle dokumenter i fuld farve eller sort-hvid tilstand.

Du kan også vælge manuelt at vælge udskriftstypen efter behov.

Et eksempel på maskinskrevet tekst. Alle bogstaver har samme bredde (sammenlign f.eks. w og t). For tekster af denne type skal du vælge Skrivemaskine.
Et eksempel på en tekst produceret af en faxmaskine. Som du kan se fra eksemplet, er bogstaverne nogle steder ikke tydelige. Der er også lidt støj og forvrængning. For tekster af denne type skal du vælge Fax.

Efter genkendelse af maskinskrevne tekster eller faxer skal du vælge Auto før behandling af regelmæssigt udskrevne dokumenter.

Udskrivningskvalitet

Dokumenter i dårlig kvalitet med "støj" (f.eks. tilfældige sorte prikker eller pletter), slørede eller ujævne bogstaver eller skæve linjer og forskudte tabelkanter, kan kræve specifikke scanningsindstillinger.

Fax Avis

Dokumenter af dårlig kvalitet scannes bedst i gråtoner. Ved scanning i gråtoner vælger programmet den optimale lysstyrkeværdi automatisk.

Gråtone-scanningstilstanden indeholder flere oplysninger om bogstaver i den scannede tekst for at opnå bedre OCR-resultater ved genkendelse af dokumenter af mellem til dårlig kvalitet. Du kan også rette nogle af fejlene manuelt ved hjælp af billedredigeringsværktøjet, som er til rådighed i Billedredigering. Se også: Hvis dit dokumentbillede har defekter, og OCR-nøjagtigheden er lav.

Farvetilstand

Hvis du ikke har brug for at bevare de originale farver, der anvendes i et fuld-farvedokument, kan du behandle dokumentet i sort-hvid tilstand. Dette vil i høj grad reducere størrelsen af det resulterende OCR-projekt og fremskynde OCR-processen. Men behandling af billeder med lav kontrast i sort og hvidt kan resultere i dårlig OCR-kvalitet. Vi anbefaler ikke sort og hvid forarbejdning til fotos, magasinsider og tekster på kinesisk, japansk og koreansk.

Tip. Du kan også fremskynde OCR af farve og sort-hvide dokumenter ved at vælge Hurtig anerkendelseOCR fanen i Indstillinger dialogboksen. For mere om genkendelsestilstande, se OCR-indstillinger.

For nogle yderligere anbefalinger om valg af den rigtige farvetilstand, se Tip til scanning.

Når dokumentet er konverteret til sort-hvid, vil du ikke være i stand til at gendanne farverne. For at få et farvedokument, skal du åbne en fil med farvebilleder eller scanne papirdokumentet i farvetilstand.

12.06.2024 14:29:24

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.