OCR-alternativ

Det är viktigt att välja rätt OCR-alternativ om du vill ha snabba och exakta resultat. När du bestämmer dig för vilka alternativ du vill använda bör du inte bara ta hänsyn till dokumentets typ och komplexitet, utan också till hur du tänkt använda resultatet. Följande alternativkategorier finns:

Du finner OCR-alternativen på fliken OCR i dialogrutan Alternativ (klicka på Verktyg > Alternativ... för att öppna dialogrutan).

ABBYY FineReader tolkar varje sida du lägger till i ett OCR-projekt. De för närvarande valda alternativen används till OCR-tolkningen. Du kan stänga av automatisk analys och OCR av tillagda bilder på fliken Bildbehandling av dialogrutan Alternativ (klicka på Verktyg > Alternativ... för att öppna dialogrutan).

Om du ändrar OCR-alternativen efter det att ett dokument har tolkats måste du köra OCR-processen igen för att tolka dokumentet med de nya alternativen.

PDF-tolkningslägen

Dessa inställningar är avsedda för PDF-dokument med textlager och bilder. Sådana PDF-dokument skapas normalt från dokument i redigerbara format. Andra typer av PDF-dokument, som t.ex. sökbara PDF:er och bildbaserade PDF:er, bearbetas alltid i läget Använd OCR, vilket är standardläge för dessa PDF-typer. Inga andra inställningar krävs för att bearbeta sådana PDF:er.

Det finns tre tolkningslägen:

  • Välj automatiskt mellan OCR och text från PDF
    Programmet kommer granska textlagret och använda det befintliga textlagret om det innehåller text av god kvalitet. I annat fall kommer OCR-tolkning användas för att skapa ett nytt textlager.
  • Använd OCR
    OCR används för att skapa ett nytt textlager. Det här läget tar mer tid, men passar bättre för dokument med textlager av dålig kvalitet.
  • Använd endast text från PDF
    Det här är standardläget för PDF-dokument med textlager. Programmet kommer använda det ursprungliga textlagret utan att köra OCR.

Balans mellan hastighet och noggrannhet i OCR-tolkningen

ABBYY FineReader 14 låter dig utföra:

  • Noggrann tolkning
    I det här läget analyserar och tolkar ABBYY FineReader både enkla dokument och dokument med komplex layout, även dokument med text utskriven på färgad bakgrund och dokument med komplexa tabeller (till exempel tabeller med vita rutnätslinjer och tabeller med färgade celler).
    Noggrann tolkning kräver mer tid, men ger bättre kvalitet.
  • Snabb tolkning
    Det här läget rekommenderas för behandling av stora dokument med enkel layout och bra bildkvalitet.

Utskriftstyp

Anger vilken typ av enhet som användes för att skriva ut dokumentet. Se även: Dokumentegenskaper att överväga innan OCR.

Detektera strukturella element

Välj de strukturella elementen du vill att programmet ska identifiera; sidhuvuden och sidfötter, fotnoter, innehållsförteckningar och listor. De valda elementen blir klickbara när dokumentet sparas.

Streckkoder

Om ditt dokument innehåller streckkoder och om du vill att de ska konverteras till strängar med bokstäver och siffror istället för att de sparas som bilder väljer du Konvertera streckkoder till strängar. Den här funktionen är avstängd som standard.

Mönster och språk

Tolkning med träning används för att tolka följande texttyper:

  • Texter med speciella symboler (t.ex. matematiska symboler)
  • Texter med dekorativa element
  • Stora textvolymer från lågkvalitativa bilder (över 100 sidor)

Träning är avstängt som standard. Aktivera Använd träning för att tolka nya tecken och ligaturer för att träna ABBYY FineReader medan du utför OCR-tolkningen.

Du kan antingen använda de inbyggda eller dina egna anpassade tolkningsmönster.

Du kan spara och ladda inställningar för användarmönster och språk. Se även: OCR-projekt.

Typsnitt

Här kan du välja typsnitten som ska användas när du sparar tolkad text.

Välja typsnitt:

  1. Klicka på Välj typsnitt... knappen.
  2. Välj de önskade typsnitten och klicka på OK.

02.11.2018 16:19:58


Please leave your feedback about this article