Dokumentegenskaper att överväga innan OCR

Kvaliteten på bilderna har en stor inverkan på OCR-kvaliteten. I det här avsnittet förklaras vilka faktorer du bör ta hänsyn till innan du tolkar bilder.

OCR-språk

ABBYY FineReader kan både tolka dokument med ett och med flera språk (t.ex. sådana som skrivits på två eller flera språk). För dokument med fler språk måste du välja flera OCR-språk.

Klicka på Alternativ > Språk för att välja OCR-språken och välj ett av följande alternativ:

  • Välj OCR-språk automatiskt från följande lista
    ABBYY FineReader väljer rätt språk automatiskt från den användardefinierade språklistan. För att redigera språklistan:
    1. Se till att alternativet Välj OCR-språk automatiskt från följande lista har valts.
    2. Klicka på Ange... knappen.
    3. Välj språken du vill ha i dialogrutan Språk och klicka på OK.
    4. Klicka AlternativOK i dialogrutan.
  • Ange OCR-språk manuellt
    Välj det här alternativet om språket du behöver inte finns med på listan.

Ange ett eller flera språk i dialogrutan nedan. Om du ofta använder en viss språkkombination kan du skapa en ny grupp för dessa språk.

Om ett språk inte finns på listan:

  1. Stöds det inte av ABBYY FineReader, eller
    Se Stödda OCR-språk för en fullständig lista på stödda språk.
  2. Stöds inte av din produktversion.
    Den fullständiga språklistan är tillgänglig i din produktversion och finns under dialogrutan Licenser (klicka på Hjälp > Om... > Licensinfo för att öppna dialogrutan).

Utöver att använda de inbyggda språken och språkgrupperna kan du också skapa dina egna språk och grupper. Se även: Om programmet inte lyckas tolka vissa tecken.

Utskriftstyp

Dokument kan skrivas ut med en rad olika enheter, som t.ex. skrivmaskiner och faxmaskiner. OCR-kvaliteten kommer variera beroende på hur ett dokument skrivits ut. Du kan förbättra OCR-kvaliteten genom att välja den korrekta utskriftstypen i dialogrutan Alternativ.

För de flesta dokumenten kommer programmet detektera deras utskriftstyp automatiskt. För automatisk detektering av utskriftstyp måste alternativet Auto väljas i alternativkategorin Dokumenttyp i dialogrutan Alternativ (klicka på Verktyg > Alternativ... > OCR för att komma till alternativen). Du kan bearbeta dokumentet i färg-eller i svartvitt läge.

Du kan också välja att lägga till utskriftstyp manuellt vid behov.

Ett exempel på maskinskriven text. Alla bokstäver är lika breda (jämför t.ex. "w" och "t"). Välj Skrivmaskin för texter av den här typen.
Ett exempel på en text som skapats av en faxmaskin. Som du ser i exemplet är bokstäverna otydliga på vissa platser. Det finns även en del brus och förvrängning. Välj Fax.

Se till att välja Auto när maskinskrivna texter eller fax har tolkats, innan du bearbetar vanliga utskrivna dokument.

Utskriftskvalitet

Dokument med dålig utskriftskvalitet och "brus" (d.v.. slumpmässiga svarta prickar eller fläckar), suddiga och ojämna bokstäver, sneda rader och förskjutna tabellkanter kan kräva andra inställningar för inläsning.

Fax Tidning

Dokument med låg utskriftskvalitet är bäst att skanna i gråskala. När du skannar i gråskala kommer programmet välja ett värde för optimal ljusstyrka automatiskt.

Skanningsläget i gråskala bevarar mer information om bokstäverna i den inlästa texten för att uppnå bättre OCR-resultat vid tolkning av medel- till lågkvalitativa dokument. Du kan också korrigera några av de vanligaste felen manuellt med hjälp av bildredigeringsverktygen som finns i bildredigeraren. Se även: Om din dokumentbild har defekter och OCR-riktigheten är låg.

Färgläge

Om du inte behöver bevara originalfärgerna i ett färgdokument kan du behandla det i läget för svartvitt. På så sätt minskas storleken på det resulterande OCR-projektet och OCR-processen påskyndas. Om bilderna du behandlar har dålig kontrast kan dock OCR-kvaliteten bli sämre om du behandlar dem i svartvitt läge. Vi rekommenderar inte heller svartvit behandling av foton, sidor från tidskrifter och texter på kinesiska, japanska och koreanska.

Tips. Du kan också påskynda OCR-tolkningen av färg och svartvita dokument genom att välja Snabb tolkning på fliken OCR i Alternativ dialogrutan. Se OCR-alternativ för mer om tolkningslägena.

Se Tips för skanning för ytterligare rekommendationer om hur man väljer rätt färgläge.

När dokumentet har konverterats till svartvitt kommer du inte kunna återställa färgerna. Öppna filen med färgbilderna eller läsa in pappersdokumentet i färgläget för att få ett färgdokument.

02.11.2018 16:19:58


Please leave your feedback about this article