Documenti redatti con alfabeti non latini

ABBYY FineReader consente di riconoscere documenti in arabo, ebraico, yiddish, tailandese, cinese, giapponese e coreano. L'elaborazione di documenti in lingua cinese, giapponese o coreana e documenti redatti in combinazioni di lingue CJK ed europee richiede alcuni ulteriori accorgimenti.

Installare i file di supporto per le lingue

Per eseguire il riconoscimento di testi scritti in arabo, ebraico, yiddish, tailandese, cinese, giapponese e coreano, potrebbe essere necessario installare i file di supporto per queste lingue.

Microsoft Windows 8 e Windows 7 supportano queste lingue per impostazione predefinita.

Per installare nuove lingue in Microsoft Windows XP:

  1. Fare clic su Start sulla barra delle applicazioni.
  2. Selezionare Pannello di controllo > Opzioni internazionali e della lingua.
  3. Fare clic sulla scheda Lingue e selezionare le seguenti opzioni:
    • Installare file per lingue a caratteri complessi e scrittura da destra a sinistra (incluso tailandese)

per il supporto di arabo, ebraico, yiddish e tailandese

  • Installa i file delle lingue dell'Asia orientale

per il supporto di giapponese, cinese e coreano

  1. Fare clic su OK.

Caratteri consigliati

Il riconoscimento di testi in lingua araba, ebraica, yiddish, tailandese, cinese, giapponese e coreana potrebbe richiedere l'installazione di alcuni caratteri aggiuntivi in Windows. Di seguito sono elencati i caratteri consigliati per i testi redatti in queste lingue.

Lingua OCR Carattere consigliato
Arabo Arial™ Unicode™ MS*
Ebraico Arial™ Unicode™ MS*
Yiddish Arial™ Unicode™ MS*
Tailandese

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Cinese (semplificato),

Cinese (tradizionale),

Giapponese, Coreano,

Coreano (Hangul)

Arial™ Unicode™ MS*

Caratteri SimSun

come: SimSun (Founder Extended), SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming (per ISO10646)

STSong

* Questo carattere viene installato con Microsoft Windows XP e Microsoft Office 2000 o versioni successive.

Le sezioni sottostanti forniscono consigli su come migliorare l'accuratezza del riconoscimento.

Disattivare l'elaborazione automatica

Per impostazione predefinita, tutte le pagine aggiunte a un documento di ABBYY FineReader vengono riconosciute automaticamente.

Se però il documento contiene testo redatto in una combinazione di lingue CJK e lingue europee, si consiglia di disattivare il rilevamento automatico dell'orientamento della pagina. È inoltre consigliabile selezionare l'opzione per la divisione delle pagina doppie solo se tutte le immagini delle pagine sono orientate correttamente (ovvero, non sono state digitalizzate capovolte).

È possibile attivare o disattivare le opzioni Rileva orientamento pagina e Dividi pagine adiacenti nella scheda Digitalizza/Apri della finestra di dialogo Opzioni.

Nota. Per dividere pagine adiacenti in arabo, ebraico o yiddish selezionare la lingua di riconoscimento corrispondente prima di selezionare l'opzione Dividi pagine adiacenti. Questo accorgimento garantisce che le pagine siano ordinate correttamente. È inoltre possibile ripristinare la numerazione originale delle pagine selezionando l'opzione Scambia pagine libro. Per informazioni dettagliate, consultare la sezione "Informazioni sui documenti FineReader."

Se la struttura del documento è complessa, si consiglia di disattivare l'analisi e il riconoscimento automatico per le immagini e di eseguire tali operazioni manualmente.

Per disattivare l'analisi e il riconoscimento automatici:

  1. Accedere alla finestra di dialogo Opzioni (Strumenti > Opzioni…).
  2. Deselezionare l'opzione Elabora automaticamente le pagine quando vengono aggiunte nella scheda Digitalizza/Apri.
  3. Fare clic su OK.

Riconoscimento di documenti redatti in più lingue

Le istruzioni riportate di seguito prendono in considerazione l'esempio di un documento contenente testo in lingua inglese e cinese.

  1. Nella barra degli strumenti principale, selezionare Altre lingue… nell'elenco a discesa Lingue del documento. Selezionare Specifica lingue manualmente nella finestra di dialogo Editor lingue e selezionare cinese e inglese nell'elenco delle lingue.
  2. Digitalizzare o aprire le immagini.
  3. Se il programma non è in grado di rilevare tutte le aree di un'immagine:
    • Specificare manualmente le aree utilizzando gli strumenti di modifica delle aree.
    • Specificare le aree che contengono una sola lingua. Per farlo, selezionare le aree e specificare la lingua corrispondente nel riquadro Proprietà area.

Importante. È possibile specificare la lingua solo per aree dello stesso tipo. Non è possibile specificare una lingua se sono selezionate aree di diverso tipo, come Testo e Tabella.

  1. Fare clic sul pulsante Leggi nella barra degli strumenti principale.

Caratteri non europei non visualizzati nella finestra Testo

Se un testo in una lingua CJK non viene visualizzato correttamente nella finestra Testo, potrebbe essere stata selezionata la modalità Testo semplice.

Per modificare il carattere utilizzato nella modalità Testo semplice:

  1. Accedere alla finestra di dialogo Opzioni (Strumenti > Opzioni…).
  2. Fare clic sulla scheda Visualizza.
  3. Selezionare Arial Unicode MS nell'elenco a discesa Tipo di carattere usato per visualizzare il testo semplice.
  4. Fare clic su OK.

Se il problema persiste e il testo nella finestra Testo continua a non essere visualizzato correttamente, consultare la sezione "Alcuni caratteri vengono sostituiti da simboli come "?" o "□" nella finestra Testo"."

Cambiare l'orientamento del testo riconosciuto

ABBYY FineReader rileva automaticamente l'orientamento del testo, ma è anche possibile specificarlo manualmente.

  1. Selezionare uno o più paragrafi nella finestra Testo.
  2. Fare clic sul pulsante nella barra degli strumenti della finestra Testo.

Nota. È possibile utilizzare l'elenco a discesa Orientamento del testo CJK nella finestra Immagine per specificare l'orientamento del testo prima di eseguire il riconoscimento. Per informazioni dettagliate, consultare la sezione Testo verticale o invertito non riconosciuto correttamente.

14.01.2020 17:26:19


Please leave your feedback about this article