Dokumentfunktioner att ta hansyn till innan OCR

Download

Kvaliteten på bilderna har en stor inverkan på tolkningskvaliteten. Det här avsnittet förklarar vilka faktorer som du bör ta hänsyn till innan du tolkar bilderna:

Dokumentspråk

ABBYY FineReader tolkar både dokument med ett och flera språk (t.ex. sådana skrivna på två eller flera språk). För dokument med fler språk måste du välja flera tolkningsspråk.

Du anger ett OCR-språk för ditt dokument genom att välja ett av följande i antingen rullisten Dokumentspråk på huvudverktygsfältet eller i fönstret Uppgift:

  • Automarkera

Rätt språk väljs automatiskt från den användardefinierade språklistan i ABBYY FineReader. Sådan ændres denne liste:

  1. Välj Fler språk…
  2. I dialogrutan Språkredigerareväljer du alternativet Välj dokumentspråk automatiskt från följande lista.
  3. Klicka på knappen Ange….
  4. I dialogrutan Språk väljer du önskade språk.
  • Ett språk eller en kombination av språk

Välj ett språk eller en språkkombination. Listan över språk innefatter nyligen tolkade språk, samt engelska, tyska och franska.

  • Fler språk…

Välj det här alternativet om språket du behöver inte syns på listan.

I dialogrutan Språkredigerare väljer du alternativet Ange språk manuellt och väljer sedan önskat språk eller såkr genom att bocka i rätt rutor. Om du ofta använder en särskild språkkombination kan du skapa en ny grupp för dessa språk.

Om ett visst språk inte finns på listan så:

  1. stöds det inte av ABBYY FineReader.

Se "Språk som stöds."

för en fullständig lista över språk som stöds.

  1. stöds det inte av ditt programexemplar.

Den fullständiga listan på tillgängliga språk i ditt exemplar visas i dialogrutan Licenser (välj Hjälp > Om… > Licensinfo).

Utöver att använda de inbyggda språken så kan du även skapa dina egna. Mer information finns i "Om programmet misslyckas med att tolka vissa tecken."

Utskriftstyp

Det går att skriva ut dokument på en rad olika enheter, som t.ex. skrivmaskiner och faxmaskiner. Du kan förbättra OCR-kvaliteten genom att välja korrekt Dokumenttyp i dialogrutan Alternativ.

För de flesta dokument kommer programmet att detektera utskriftstypen automatiskt. Om du vill ha automatisk detektering av utskriftstyp så måste du ha valt alternativet Auto under Dokumenttyp i dialogrutan Alternativ (Verktyg > Alternativ…). Du kan bearbeta dokumentet i färgläget eller i svartvitt läge.

Du kan även välja utskriftstypen manuellt efter behov.

Ett exempel på maskinskriven text. Alla bokstäver är lika breda (jämför, t.ex., "w" och "t"). Välj Skrivmaskinför texter av den här typen.
Ett exempel på en text producerad av en faxmaskin. Som du ser i exemplet så är tecknen otydliga här och var, utöver skräp och förvrängning. Välj Fax för texter av den här typen.

Tips! När du är klar med tolkningen av maskinskriven text eller fax måste du välja Auto innan du behandlar vanliga utskriftsdokument.

Utskriftskvalitet

Lågkvalitativa dokument med "brus" (dvs. slumpvisa svart pricker eller fläckar), oskarpa eller ojämna tecken eller lutande rader och förskjutna tabellkanter kan behöva särskilda inläsningsinställningar.

Fax Tidning

Dokumenter i dårlig kvalitet scannes bedst i gråtoner. Ved scanning i gråtoner vælger programmet automatisk den optimale lysstyrke.

Inläsning av lågkvalitativa dokument i gråskala ger bäst resultat. När du läser in i gråskala så kommer programmet att välja det optimala värdet för ljusstyrka automatiskt. Inläsningsläget i gråskala bevarar mer information om bokstäverna i den inlästa texten för att uppnå bättre OCR-resultat vid tolkning av medel- till lågkvalitativa dokument. Mer information finns i "Bildförbehandling."

Färgläge

Om du inte behöver bevara originalfärgerna i ett färgdokument så kan du bearbeta dokumentet i det svartvita läget. Det här kommer att minska storleken på det resulterande FineReader-dokumentet avsevärt och snabba på OCR-processen. Men bearbetning av svartvita bilder med låg kontrast kan resultera i dålig OCR-kvalitet. Vi rekommenderar inte heller svartvit bearbetning för foton, tidningssidor och texter på kinesiska, japanska och koreanska.

Obs! Om du vill att tolkningen av färgdokument och svartvita dokument ska gå snabbare kan du även markera alternativet Snabb läsning på fliken Läs i dialogrutan Alternativ. Mer information finns i OCR-alternativ.

Så här väljer du ett färgläge:

  • Använd rullisten Färgläge i dialogrutan Uppgift eller
  • Välj ett av alternativen under Färgläge från fliken Dokument i dialogrutan Alternativ (Verktyg > Alternativ…).

Viktigt! När du väl har konverterat ett dokument till svartvitt kan du inte återställa färgerna igen. Om du vill ha ett färgdokument ska du öppna filen med färgbilderna eller läsa in pappersdokumentet i färgläget.

14.01.2020 17:26:21

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.