Εργασία με γλώσσες σύνθετης γραφής

Με το ABBYY FineReader μπορείτε να αναγνωρίζετε έγγραφα στα Αραβικά, τα Εβραϊκά, τα Γίντις, τα Ταϊλανδικά, τα Κινεζικά, τα Ιαπωνικά και τα Κορεατικά. Ορισμένοι πρόσθετοι παράγοντες πρέπει να λαμβάνονται υπόψη κατά την εργασία με έγγραφα στα Κινεζικά, τα Ιαπωνικά ή τα Κορεατικά και με έγγραφα στα οποία χρησιμοποιείται ένας συνδυασμός Κινεζικής/Ιαπωνικής/Κορεατικής και ευρωπαϊκών γλωσσών.

Συνιστώμενες γραμματοσειρές

Η αναγνώριση κειμένου στα Αραβικά, στα Εβραϊκά, στα Γίντις, στα Ταϊλανδικά, στα Κινεζικά, στα Ιαπωνικά και στα Κορεατικά ενδέχεται να απαιτεί την εγκατάσταση πρόσθετων γραμματοσειρών. Στον παρακάτω πίνακα παρατίθενται οι συνιστώμενες γραμματοσειρές για κείμενα σε αυτές τις γλώσσες.

Γλώσσες OCR Συνιστώμενη γραμματοσειρά
Αραβικά Arial™ Unicode™ MS
Εβραϊκά Arial™ Unicode™ MS
Γίντις Arial™ Unicode™ MS
Ταϊλανδικά

Arial™ Unicode™ MS

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Κινεζικά (Απλοποιημένα)

Κινεζικά (Παραδοσιακά)

Ιαπωνικά, Κορεατικά

Κορεατικά (Χανγκίλ)

Arial™ Unicode™ MS

Γραμματοσειρές SimSun όπως:

Παράδειγμα SimSun (Founder Extended),

SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming (για ISO10646)

STSong

Οι παρακάτω ενότητες περιλαμβάνουν συμβουλές για τη βελτίωση της ακρίβειας της αναγνώρισης.

Απενεργοποίηση αυτόματης επεξεργασίας εικόνας

Από προεπιλογή, όλες οι σελίδες που προσθέτετε σε ένα έργο OCR αναγνωρίζονται αυτόματα.

Ωστόσο, εάν το έγγραφό σας περιέχει ένα κείμενο σε κινεζική/ιαπωνική/κορεατική γλώσσα σε συνδυασμό με μια ευρωπαϊκή γλώσσα, σας συνιστούμε να απενεργοποιήσετε τον αυτόματο εντοπισμό του προσανατολισμού της σελίδας και να χρησιμοποιήσετε την επιλογή διαχωρισμού διπλών σελίδων μόνο εάν όλες οι εικόνες των σελίδων έχουν σωστό προσανατολισμό (π.χ. δεν σαρώθηκαν ανάποδα).

Μπορείτε να ενεργοποιήσετε/απενεργοποιήσετε Διόρθωση προσανατολισμού σελίδας και Διαχωρισμός αντικριστών σελίδων την επιλογή  Επεξεργασία εικόνας στην καρτέλα του Επιλογές πλαισίου διαλόγου (κάντε κλικ στην επιλογή Εργαλεία > Επιλογές... για να ανοίξετε αυτό το πλαίσιο διαλόγου).

Για να διαχωρίσετε αντικριστές σελίδες στα Αραβικά, Εβραϊκά ή Γίντις, βεβαιωθείτε ότι έχετε επιλέξει την αντίστοιχη γλώσσα OCR πρώτα και μόνο τότε ενεργοποιήστε Διαχωρισμός αντικριστών σελίδων την επιλογή. Μπορείτε επίσης να επαναφέρετε την αρχική αρίθμηση σελίδων ενεργοποιώντας Εναλλαγή σελίδων βιβλίου την επιλογή. Δείτε επίσης: Έργα OCR.

Εάν το έγγραφό σας έχει μια σύνθετη δομή, συνιστούμε να απενεργοποιήσετε την αυτόματη ανάλυση και την οπτική αναγνώριση χαρακτήρων για εικόνες και να εκτελέσετε αυτές τις εργασίες με μη αυτόματο τρόπο.

Μπορείτε να απενεργοποιήσετε την αυτόματη ανάλυση και την οπτική αναγνώριση χαρακτήρων των εικόνων που προστέθηκαν πρόσφατα στην Επεξεργασία εικόνας καρτέλα του Επιλογές πλαισίου διαλόγου (κάντε κλικ στην επιλογή Εργαλεία > Επιλογές... για να ανοίξετε αυτό το πλαίσιο διαλόγου).

  1. Κάντε κλικ Εργαλεία > Επιλογές... για ναανοίξετε το Επιλογές πλαίσιο διαλόγου.
  2. Στην Επεξεργασία εικόνας καρτέλα καταργήστε Αυτόματη επεξεργασία εικόνων σελίδας ενώ προστίθενται στον Επεξεργαστή OCR την επιλογή.
  3. Κάντε κλικ στο κουμπί ΟΚ.

Αναγνώριση εγγράφων γραμμένων σε περισσότερες από μία γλώσσες

Οι παρακάτω οδηγίες παρέχονται ως παράδειγμα και εξηγούν πώς να αναγνωρίζετε ένα έγγραφο που περιέχει κείμενο τόσο στα Αγγλικά όσο και στα Κινεζικά. Έγγραφα που περιέχουν άλλες γλώσσες μπορούν να αναγνωριστούν με παρόμοιο τρόπο.

  1. Στην κύρια γραμμή εργαλείων, επιλέξτε Περισσότερες γλώσσες... από τη λίστα γλωσσών. Στο Επεξεργαστής γλώσσας πλαίσιο διαλόγου επιλέξτε Μη αυτόματος προσδιορισμός γλωσσών για το OCR και επιλέξτε Κινεζικά και Αγγλικά από τη λίστα των γλωσσών.
  2. Σαρώστε τις σελίδες σας ή ανοίξτε τις εικόνες σας.
  3. Εάν το πρόγραμμα δεν ανιχνεύσει όλες τις περιοχές σε μια εικόνα:
    • Καθορίστε τις περιοχές με μη αυτόματο τρόπο χρησιμοποιώντας τα εργαλεία επεξεργασίας περιοχής
    • Καθορίστε τις περιοχές που περιέχουν μόνο μία γλώσσα και στην ενότητα Ιδιότητες περιοχής επιλέξτε Αγγλικά ή Κινεζικά ανάλογα με την περίπτωση.
      Οι γλώσσες μπορούν να καθοριστούν μόνο για περιοχές ίδιου τύπου. Εάν επιλέξατε περιοχές διαφορετικών τύπων, όπως Κείμενο και Πίνακα, δεν θα μπορείτε να καθορίσετε μια γλώσσα.
    • Εάν είναι απαραίτητο, επιλέξτε την κατεύθυνση κειμένου από την Προσανατολισμός αναπτυσσόμενη λίστα (για λεπτομέρειες, βλ. Εάν δεν αναγνωρίστηκε κατακόρυφο ή ανεστραμμένο κείμενο)
    • Για τα κείμενα στα Κινεζικά, Ιαπωνικά και Κορεατικά, το πρόγραμμα παρέχει μια επιλογή από κατευθύνσεις του κειμένου στην Κατεύθυνση κειμένου Κινεζικής/Ιαπωνικής/Κορεατικής αναπτυσσόμενη λίστα (για λεπτομέρειες, βλ. Επεξεργασία ιδιοτήτων περιοχής).

Εάν δεν είναι δυνατή η εμφάνιση μη-ευρωπαϊκών χαρακτήρων στο παράθυρο «Κείμενο»

Εάν το κείμενο στα Κινεζικά, Ιαπωνικά, Κορεατικά, εμφανίζεται εσφαλμένα στο παράθυροΚείμενο , μπορεί να έχετε επιλέξει τη Απλό κείμενο λειτουργία.

Για να αλλάξετε τη γραμματοσειρά που χρησιμοποιείται στη Απλό κείμενο λειτουργία:

  1. Κάντε κλικ Εργαλεία > Επιλογές... για ναανοίξετε το Επιλογές πλαίσιο διαλόγου.
  2. Κάντε κλικ στην Περιοχές\nκαι κείμενο ετικέτα.
  3. Επιλέξτε Arial Unicode MS από την Γραμματοσειρά που χρησιμοποιείται για την προβολή απλού κειμένου αναπτυσσόμενη λίστα.
  4. Κάντε κλικ ΟΚ.

Εάν αυτό δεν βοήθησε και το κείμενο στο παράθυρο Κείμενο εξακολουθεί να εμφανίζεται λανθασμένα, δείτε Χρησιμοποιείται λανθασμένη γραμματοσειρά ή ορισμένοι χαρακτήρες αντικαθίστανται από το σύμβολο «?» ή «□».

Αλλαγή κατεύθυνσης του αναγνωρισμένου κειμένου

Το ABBYY FineReader ανιχνεύει αυτόματα την κατεύθυνση του κειμένου, αλλά μπορείτε επίσης να ορίσετε την κατεύθυνση του κειμένου χειροκίνητα.

  1. Ενεργοποιήστε το παράθυρο «Κείμενο».
  2. Επιλέξτε μία ή περισσότερες παραγράφους.
  3. Κάντε κλικ στο κουμπί στη γραμμή εργαλείων στο παράθυρο «Κείμενο»

Μπορείτε να χρησιμοποιήσετε την Κατεύθυνση κειμένου Κινεζικής/Ιαπωνικής/Κορεατικής αναπτυσσόμενη λίστα στο παράθυρο «Εικόνα» για να προσδιορίσετε την κατεύθυνση του κειμένου πριν την οπτική αναγνώριση χαρακτήρων. Δείτε επίσης: Επεξεργασία ιδιοτήτων περιοχής.

11/2/2018 4:19:16 PM


Please leave your feedback about this article