Om programmet inte lyckas tolka vissa tecken

Download

ABBYY FineReader PDF använder data om dokumentspråket vid tolkning av text. Programmet kan misslyckas med att tolka vissa tecken i dokumentet med ovanliga element (t.ex. kodnummer) eftersom dokumentspråket inte innehåller dessa tecken. För att tolka sådana dokument måste man skapa ett anpassat språk som innehåller alla nödvändiga tecken. Du kan också skapa grupper med flera OCR-språk och använda dem när dokument ska tolkas.

Så skapar man ett användarspråk

  1. Öppna Alternativ dialogrutan (klicka på Verktyg > Alternativ... för att öppna denna dialogruta), klicka på Språk fliken.
  2. Nytt... knappen i dialogrutan.
  3. I dialogrutan som öppnas, välj Skapa ett nytt språk baserat på ett befintligt språk alternativet, välj det språk du vill använda som grund för det nya språket och klicka på OK.
  4. Språkegenskaper dialogrutan öppnas. I denna dialogruta:
    1. Skriv ett namn på ditt nya språk.
    2. Det språk du har valt i Nytt språk eller ny grupp dialogrutan visas i Källspråk rullgardinsmenyn. Det går att välja ett annat språk från denna rullgardinsmeny.
    3. Alfabet innehåller grundspråkets alfabet. Om du vill redigera alfabetet, klicka på knappen i dialogrutan.
    4. Ordlista-gruppalternativet innehåller flera alternativ för ordboken som kommer att användas av programmet när text ska tolkas och resultat ska undersökas:
      • Ingen
        Språket har ingen ordbok.
      • Inbyggd ordlista
        Programmets inbyggda ordbok kommer att användas.
      • Egen ordlista
        Redigera... knappen för att ange termer i ordlista eller importera en befintlig anpassad ordlista eller textfil med Windows-1252-kodning (termerna måste skiljas åt med blanksteg eller andra tecken som inte finns i alfabetet).
        Ord från användarordlistan kommer inte att markeras som felaktiga när stavningen i den tolkade texten kontrolleras. De kan skrivas helt i gemener eller versaler, eller börja med en versal.
Ordet finns i ordlistan Ord som inte kommer betraktas som felaktiga under en stavningskontroll
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Reguljärt uttryck gör att det går att skapa en användarordlista med hjälp av vanliga uttryck.
    Se även: Vanliga uttryck.
  1. Språk kan ha flera ytterligare egenskaper. För att ändra desa egenskaper klicka på Avancerat... knappen för att öppna Avancerade språkegenskaper dialogrutan där du kan ange:
    • Tecken som kan börja eller sluta med ett ord
    • Tecken utan bokstäver som visas separat från ord
    • Tecken som kan förekomma i ord, men som ska ignoreras
    • Tecken som inte kan visas i text som tolkas med det här språket (otillåtna tecken)
    • Texten kan innehålla arabiska siffror, romerska siffror och förkortningar alternativet
  1. Du kan nu välja det nyligen skapade språket när du väljer OCR-språk.
    För fler OCR-språk, se OCR-språk.

Som standard kommer användarspråket sparas i OCR-projektets mapp. Det går också att spara alla användarmönster och språk i en enda fil. För att göra detta,öppna Alternativ dialogrutan (klicka på Verktyg > Alternativ... för att öppna denna dialogruta), klicka på OCR fliken och sedan på Spara mönster och språk... knappen i dialogrutan.

Så skapar man en språkgrupp

Om du ska använda en viss språkkombination regelbundet vill du eventuellt gruppera ihop språken av praktiska skäl.

  1. Öppna Alternativ dialogrutan (klicka på Verktyg > Alternativ... för att öppna denna dialogruta) och klicka på Språk fliken.
  2. Nytt... knappen i dialogrutan.
  3. I Nytt språk eller ny grupp dialogrutan, välj Skapa en ny språkgrupp alternativet och klicka på OK.
  4. Språkgruppsegenskaper dialogrutan öppnas. Ange ett namn på språkgruppen i denna dialogruta och välj de språk du vill att gruppen ska innehålla.
    Om du vet att texten inte kommer att innehålla vissa tecken kan det vara praktiskt att ange dem som förbjudna tecken. Detta kan öka OCR-motorns hastighet och noggrannhet. För att ange dessa tecken, klicka på Avancerat... knappen i Språkgruppsegenskaper dialogrutan och ange förbjudna tecken i Otillåtna tecken fältet.
  5. Klicka på OK.

Den nya gruppen visas i rullgardinsmenyn med språk i huvudverktygsfältet.

Som standard sparas språkgrupper i samma katalog som OCR-projektet. Det går också att spara alla användarmönster och språk i en enda fil. För att göra detta,öppna Alternativ dialogrutan (klicka på Verktyg > Alternativ... för att öppna denna dialogruta), klicka på OCR fliken och sedan på Spara mönster och språk... knappen i dialogrutan.

Tips. Du kan använda rullgardinsmenyn med språk i huvudverktygsfältet för att välja en språkgrupp.

  1. Välj Fler språk... från rullgardinsmenyn med språk i huvudverktygsfältet.
  2. I Språkredigeraren dialogrutan, välj Ange OCR-språk manuellt alternativet.
  3. Välj önskat språk och klicka på OK.

6/12/2024 2:31:41 PM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.