Caratteristiche dei documenti da considerare prima del riconoscimento

La qualità delle immagini incide considerevolmente sulla qualità del riconoscimento OCR. Questa sezione descrive i fattori da tenere in considerazione prima di eseguire il riconoscimento delle immagini.

Lingue OCR

ABBYY FineReader è in grado di riconoscere documenti redatti in un'unica lingua o in più lingue (ovvero contenenti testo scritto in due o più lingue). Per i documenti multilingue è necessario selezionare diverse lingue OCR.

Per selezionare le lingue OCR, fare clic su Opzioni > Lingue e selezionare una delle seguenti opzioni:

  • Selezionare automaticamente le lingue OCR dal seguente elenco
    Selezionando questa opzione ABBYY FineReader seleziona automaticamente le lingue corrette nell'elenco di lingue definito dall'utente. Per modificare l'elenco delle lingue:
    1. Assicurarsi che l'opzione Selezionare automaticamente le lingue OCR dal seguente elenco sia selezionata.
    2. Fare clic sul pulsante Specifica....
    3. Nella sezione Lingue selezionare le lingue desiderate e fare clic su OK.
    4. Nella sezione Opzioni fare clic su OK.
  • Specifica manualmente le lingue OCR
    Selezionare questa opzione se la lingua richiesta non compare nell'elenco.

Nella finestra di dialogo sottostante, specificare una o più lingue. Se si utilizza spesso una specifica combinazione di lingue, è possibile creare un nuovo gruppo per queste lingue.

Se una lingua non è presente nell'elenco, potrebbe essere:

  1. Non supportata da ABBYY FineReader oppure
    Per un elenco completo delle lingue supportate, consultare Lingue OCR supportate.
  2. Non supportata dalla versione in uso del prodotto.
    L'elenco completo delle lingue disponibili nella versione in uso del prodotto è disponibile nella finestra di dialogo Licenze (fare clic su Guida > Informazioni... > Informazioni sulla licenza per aprire questa finestra di dialogo).

Oltre a utilizzare le lingue e i gruppi di lingue incorporati, è inoltre possibile creare lingue e gruppi di lingue personalizzati. Consultare anche: Alcuni caratteri vengono riconosciuti in modo non corretto.

Tipo di stampa

I documenti possono essere stampati con diversi dispositivi, come macchine per scrivere e fax. La qualità del riconoscimento OCR può variare a seconda di come è stato stampato un documento. È possibile migliorare la qualità del riconoscimento OCR selezionando il tipo di stampa corretto nella finestra di dialogo Opzioni.

Per la maggior parte dei documenti, il programma rileva automaticamente il tipo di stampa. Per il rilevamento automatico del tipo di stampa, è necessario che l'opzione Auto sia selezionata nel gruppo di opzioniTipo di documento nella finestra di dialogo Opzioni (fare clic su Strumenti > Opzioni... > OCR per accedere a queste opzioni). È possibile elaborare i documenti in modalità a colori o bianco e nero.

È anche possibile selezionare manualmente il tipo di stampa, se necessario.

Esempio di testo dattiloscritto. Le lettere hanno tutte la stessa larghezza (confrontare ad esempio i caratteri "w" e "t"). Per testi di questo tipo, selezionare Macchina per scrivere.
Esempio di testo prodotto da un apparecchio fax. Come illustrato nell'esempio, le lettere in alcune parti del testo non sono chiare. Sono inoltre presenti rumore e distorsione. Per testi di questo tipo, selezionare Fax.

Dopo il riconoscimento di testi dattiloscritti o fax, assicurarsi di selezionare Auto prima di elaborare normali documenti stampati.

Qualità di stampa

I documenti di scarsa qualità che presentano "rumore" (ad esempio punti neri o macchie), lettere sfocate e non uniformi, righe inclinate e separatori di tabella dislocati potrebbero richiedere delle specifiche impostazioni di digitalizzazione.

Fax Giornale

La digitalizzazione di documenti di scarsa qualità fornisce risultati migliori in scala di grigi. Quando si esegue la digitalizzazione in scala di grigi, il programma seleziona automaticamente il valore ottimale di luminosità.

La modalità di digitalizzazione in scala di grigi consente di conservare una maggior quantità di informazioni sul testo digitalizzato, garantendo risultati migliori nel riconoscimento di documenti di qualità media e scarsa. È anche possibile correggere manualmente alcuni difetti usando gli strumenti di modifica dell'immagine disponibili nell'Editor immagini. Consultare anche: L'immagine del documento presenta difetti e la precisione del riconoscimento OCR è scarsa.

Modalità colore

Se non è necessario conservare i colori di un documento a colori di origine, è possibile eseguire l'elaborazione in modalità bianco e nero. Questo consente di ridurre notevolmente le dimensioni del progetto OCR ottenuto e di velocizzare il processo di riconoscimento. L'elaborazione di immagini a basso contrasto in bianco e nero potrebbe tuttavia produrre risultati OCR di scarsa qualità. Si consiglia inoltre di non eseguire l'elaborazione in bianco e nero di fotografie, pagine di riviste e testi redatti in cinese, giapponese e coreano.

Suggerimento. È anche possibile accelerare il riconoscimento OCR di documenti a colori e in bianco e nero selezionando Riconoscimento rapido nella barra degli strumenti OCR della finestra di dialogo Opzioni. Per ulteriori informazioni sulle modalità di riconoscimento, consultare Opzioni OCR.

Per ulteriori consigli sulla selezione della corretta modalità di colore, consultare Suggerimenti per la digitalizzazione.

Una volta eseguita la conversione in bianco e nero, non è possibile ripristinare i colori originali del documento. Per ottenere un documento a colori, aprire file con immagini a colori o digitalizzare i documenti cartacei in modalità a colori.

02.11.2018 16:19:28


Please leave your feedback about this article