Alcuni caratteri vengono riconosciuti in modo non corretto

ABBYY FineReader 14 utilizza informazioni sulla lingua del documento durante il riconoscimento del testo. Il programma potrebbe non essere in grado di riconoscere alcuni caratteri nei documenti contenenti elementi non comuni, ad esempio codici numerici, poiché la lingua del documento potrebbe non contenere tali caratteri. Per il riconoscimento di tali documenti è possibile creare una lingua personalizzata contenente tutti i caratteri necessari. È inoltre possibile creare gruppi di più lingue OCR e usarli durante il riconoscimento dei documenti.

Creare una lingua definita dall'utente

  1. Aprire la finestra di dialogo Opzioni (fare clic su Strumenti > Opzioni... per aprire questa finestra di dialogo), fare clic sulla scheda Lingue.
  2. Fare clic sul pulsante Nuovo....
  3. Nella finestra di dialogo visualizzata, selezionare l'opzione Crea nuova lingua basata su una esistente quindi selezionare la lingua che si desidera utilizzare come base per la nuova lingua e fare clic su OK.
  4. Verrà visualizzata la finestra di dialogo Proprietà lingua. Nella finestra di dialogo:
    1. Digitare il nome della nuova lingua.
    2. La lingua selezionata nella finestra di dialogo Nuova lingua o gruppo è visualizzata nell'elenco a discesa Lingua sorgente. Da questo elenco a discesa è possibile selezionare una lingua diversa.
    3. Questo Alfabeto contiene l'alfabeto della lingua base. Se si desidera modificare l'alfabeto, fare clic sul pulsante .
    4. Il gruppo di opzioni Dizionario contiene diverse opzioni per il dizionario utilizzato dal programma durante il riconoscimento del testo e il controllo dei risultati:
      • Nessuno
        Per la lingua non sarà disponibile alcun dizionario.
      • Dizionario incorporato
        Verrà utilizzato il dizionario incorporato del programma.
      • Dizionario utente
        Fare clic sul pulsante Modifica... per specificare i termini del dizionario o importare un dizionario personalizzato già esistente o un file di testo con codifica Windows-1252 (i lemmi devono essere separati da spazi o altri caratteri non alfabetici).
        Le parole presenti nel dizionario utente non saranno contrassegnate come errori durante il controllo ortografico del testo riconosciuto. Le parole possono essere scritte con caratteri tutti minuscoli, con caratteri tutti maiuscoli o con iniziale maiuscola.
Parola presente nel dizionario Parole non considerate errate durante il controllo ortografico
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Il riquadro Espressione regolare consente di creare un dizionario utente utilizzando espressioni regolari.
    Consultare anche: Espressioni regolari.
  1. Le lingue possono avere diverse proprietà aggiuntive. Per modificare queste proprietà, fare clic sul pulsante Avanzate... per aprire la finestra di dialogo Proprietà avanzate lingua che consente di specificare:
    • I caratteri ammessi a inizio o fine parola
    • I caratteri non alfabetici che compaiono separatamente dalle parole
    • I caratteri ammessi all'interno delle parole ma che vanno ignorati
    • I caratteri che non possono comparire nei testi riconosciuti nella lingua selezionata (caratteri non consentiti)
    • Il riquadro Il testo può contenere numeri arabi, numeri romani e abbreviazioni option
  2. È ora possibile selezionare la lingua creata al momento della selezione delle lingue OCR.
    Per ulteriori informazioni sulle lingue OCR, consultare Lingue OCR.

Per impostazione predefinita, la lingua definita dall'utente è salvata nella cartella del progetto OCR. È inoltre possibile salvare tutte le lingue e i modelli definiti dall'utente in un singolo file. Per far ciò,aprire la finestra di dialogo Opzioni (fare clic su Strumenti > Opzioni... per aprire questa finestra di dialogo), fare clic sulla scheda OCR quindi fare clic sul pulsante Salva lingue e modelli....

Creare un gruppo di lingue

Se si pianifica di utilizzare regolarmente una specifica combinazione di lingue, è possibile raggruppare le lingue per una maggiore comodità.

  1. Aprire la finestra di dialogo Opzioni (fare clic su Strumenti > Opzioni... per aprire questa finestra di dialogo) e fare clic sulla scheda Lingue.
  2. Fare clic sul pulsante Nuovo....
  3. Nella finestra di dialogo Nuova lingua o gruppo selezionare l'opzione Crea nuovo gruppo di lingue e fare clic su OK.
  4. Il riquadro Proprietà gruppo di lingue. Nella finestra di dialogo, specificare un nome per il gruppo di lingue e selezionare le lingue da includere nel gruppo.
    Se si è certi che il testo non contiene determinati caratteri, è possibile specificarli esplicitamente come caratteri non consentiti. Questo potrebbe migliorare la velocità e la precisione dell'OCR. Per specificare tali caratteri, fare clic sul pulsante Avanzate... nella finestra di dialogo Proprietà gruppo di lingue e inserire i caratteri proibiti nel campo Caratteri non consentiti.
  5. Fare clic su OK.

Il nuovo gruppo comparirà nell'elenco a discesa delle lingue sulla barra degli strumenti principale.

Per impostazione predefinita, i gruppi di lingue definiti dall'utente vengono salvati nella cartella del progetto OCR. È inoltre possibile salvare tutte le lingue e i modelli definiti dall'utente in un singolo file. Per far ciò,aprire la finestra di dialogo Opzioni (fare clic su Strumenti > Opzioni... per aprire questa finestra di dialogo), fare clic sulla scheda OCR quindi fare clic sul pulsante Salva lingue e modelli....

Suggerimento. Per selezionare un gruppo di lingue, è possibile utilizzare l'elenco a discesa delle lingue sulla barra degli strumenti principale.

  1. Selezionare Altre lingue... dall'elenco a discesa delle lingue nella barra degli strumenti principale.
  2. Nella finestra di dialogo Editor lingue selezionare l'opzione Specifica manualmente le lingue OCR.
  3. Selezionare le lingue desiderate e fare clic su OK.

11/2/2018 4:19:28 PM


Please leave your feedback about this article