Εάν το πρόγραμμα δεν αναγνωρίζει ορισμένους χαρακτήρες

Το ABBYY FineReader 14 χρησιμοποιεί δεδομένα σχετικά με τη γλώσσα του εγγράφου όταν αναγνωρίζετε το κείμενο. Το πρόγραμμα ενδέχεται να μην αναγνωρίζει ορισμένους χαρακτήρες σε έγγραφα με ασυνήθιστα στοιχεία (π.χ. κωδικοί αριθμοί) επειδή η γλώσσα του εγγράφου μπορεί να μην περιλαμβάνει αυτούς τους χαρακτήρες. Για την αναγνώριση αυτών των εγγράφων, μπορείτε να δημιουργήσετε μια προσαρμοσμένη γλώσσα που περιλαμβάνει όλους τους απαιτούμενους χαρακτήρες. Μπορείτε, επίσης, να δημιουργήσετε ομάδες αρκετών γλωσσών OCR και να χρησιμοποιήσετε αυτές τις ομάδες όταν αναγνωρίζετε έγγραφα.

Δημιουργία μίας γλώσσας χρήστη

  1. Ανοίξτε το πλαίσιο διαλόγου Επιλογές (κάντε κλικ στην επιλογή Εργαλεία > Επιλογές... για να ανοίξετε το πλαίσιο διαλόγου), κάντε κλικ στην καρτέλα Γλώσσες.
  2. Κάντε κλικ στο κουμπί Νέο....
  3. Στο πλαίσιο διαλόγου που ανοίγει, επιλέξτε το στοιχείο Δημιουργία νέας γλώσσας βάσει μίας υφιστάμενης, επιλέξτε τη γλώσσα που θέλετε να χρησιμοποιήσετε ως βάση για τη νέα γλώσσα και κάντε κλικ στην επιλογή OK.
  4. Το πλαίσιο διαλόγου Ιδιότητες γλώσσας θα ανοίξει. Σε αυτό το πλαίσιο διαλόγου:
    1. Πληκτρολογήστε ένα όνομα για τη νέα σας γλώσσα.
    2. Η γλώσσα που επιλέξατε στο πλαίσιο διαλόγου Νέα γλώσσα ή ομάδα εμφανίζεται στην αναπτυσσόμενη λίστα Γλώσσα προέλευσης. Μπορείτε να επιλέξετε μια διαφορετική γλώσσα από αυτήν την αναπτυσσόμενη λίστα.
    3. Το Αλφάβητο περιλαμβάνει το αλφάβητο της βασικής γλώσσας. Αν θέλετε να επεξεργαστείτε το αλφάβητο, κάντε κλικ στο κουμπί .
    4. Η ομάδα επιλογών Λεξικό περιέχει διάφορες επιλογές για το λεξικό που θα χρησιμοποιηθεί από το πρόγραμμα κατά την αναγνώριση κειμένου και τον έλεγχο του αποτελέσματος:
      • Καμία
        Η γλώσσα δεν θα διαθέτει λεξικό.
      • Ενσωματωμένο λεξικό
        Θα χρησιμοποιηθεί το ενσωματωμένο λεξικό του προγράμματος.
      • Λεξικό χρήστη
        Κάντε κλικ στο κουμπί Επεξεργασία... για να ορίσετε όρους λεξικού ή να εισάγετε ένα υφιστάμενο προσαρμοσμένο λεξικό ή αρχείο κειμένου με κωδικοποίηση Windows-1252 (οι όροι πρέπει να διαχωρίζονται με κενά ή άλλους χαρακτήρες που δεν περιλαμβάνονται στο αλφάβητο).
        Οι λέξεις από το λεξικό χρήστη δεν επισημαίνονται ως λάθη κατά τον ορθογραφικό έλεγχο στο αναγνωρισμένο κείμενο. Μπορούν να είναι γραμμένες μόνο με πεζά ή μόνο κεφαλαία γράμματα ή μπορούν να αρχίζουν με κεφαλαίο.
Λέξη που περιλαμβάνεται στο λεξικό Λέξεις που δεν θεωρούνται λάθος κατά τον ορθογραφικό έλεγχο
αβγ αβγ, Αβγ, ΑΒΓ
Αβγ αβγ, Αβγ, ΑΒΓ
ΑΒΓ αβγ, Αβγ, ΑΒΓ
Αβγ αΒγ, αβγ, Αβγ, ΑΒΓ
  • Το Κανονική έκφραση σάς δίνει τη δυνατότητα να δημιουργήσετε ένα έγγραφο χρήστη χρησιμοποιώντας κανονικές εκφράσεις.
    Δείτε επίσης: Κανονικές εκφράσεις.
  1. Οι γλώσσες μπορούν να έχουν πολλές πρόσθετες ιδιότητες. Για να αλλάξετε αυτές τις ιδιότητες, κάντε κλικ στο κουμπί Προηγμένες ρυθμίσεις... για να ανοίξετε το πλαίσιο διαλόγου Προηγμένες ιδιότητες γλώσσας, όπου μπορείτε να ορίσετε:
    • Χαρακτήρες με τους οποίους μπορεί να αρχίζει ή να τελειώνει μια λέξη
    • Χαρακτήρες εκτός γραμμάτων που εμφανίζονται χωριστά από λέξεις
    • Χαρακτήρες που μπορεί να εμφανίζονται μέσα σε λέξεις αλλά θα πρέπει να αγνοούνται
    • Χαρακτήρες που δεν μπορούν να εμφανίζονται σε κείμενο που αναγνωρίζεται με τη συγκεκριμένη γλώσσα (απαγορευμένοι χαρακτήρες)
    • Η επιλογή Το κείμενο μπορεί να περιέχει αραβικούς αριθμούς, ρωμαϊκούς αριθμούς και συντομογραφίες option
  2. Τώρα μπορείτε να επιλέξετε τη γλώσσα που μόλις δημιουργήσατε κατά την επιλογή γλώσσας OCR.
    Για περισσότερες πληροφορίες σχετικά με τις γλώσσες OCR, βλ. Γλώσσες OCR.

Από προεπιλογή, η γλώσσα χρήστη αποθηκεύεται στο φάκελο του έργου OCR. Μπορείτε επίσης να αποθηκεύσετε όλα τα μοτίβα και τις γλώσσες χρήστη σε ένα αρχείο. Για να το κάνετε αυτό,ανοίξτε το πλαίσιο διαλόγου Επιλογές (κάντε κλικ στην επιλογή Εργαλεία > Επιλογές... για να ανοίξετε το πλαίσιο διαλόγου), κάντε κλικ στην καρτέλα OCR και, στη συνέχεια, κάντε κλικ στο κουμπί Αποθήκευση μοτίβων και γλωσσών....

Δημιουργία ομάδας γλωσσών

Αν σκοπεύετε να χρησιμοποιείτε τακτικά έναν συγκεκριμένο γλωσσικό συνδυασμό, ίσως θέλετε να ομαδοποιήσετε αυτές τις γλώσσες για ευκολία.

  1. Ανοίξτε το πλαίσιο διαλόγου Επιλογές (κάντε κλικ στην επιλογή Εργαλεία > Επιλογές... για να ανοίξετε το πλαίσιο διαλόγου), κάντε κλικ στην καρτέλα Γλώσσες.
  2. Κάντε κλικ στο κουμπί Νέο....
  3. Στο πλαίσιο διαλόγου Νέα γλώσσα ή ομάδα, επιλέξτε το στοιχείο Δημιουργία νέας ομάδας γλωσσών, και κάντε κλικ στο OK.
  4. Το πλαίσιο διαλόγου Ιδιότητες ομάδας γλωσσών θα ανοίξει. Σε αυτό το πλαίσιο διαλόγου, ορίστε ένα όνομα για την ομάδα γλωσσών και επιλέξτε τις γλώσσες που θέλετε να συμπεριλάβετε στην ομάδα.
    Εάν γνωρίζετε ότι το κείμενό σας δεν θα περιέχει ορισμένους χαρακτήρες, μπορείτε να τους καθορίσετε συγκεκριμένα ως απαγορευμένους χαρακτήρες. Με αυτόν τον τρόπο μπορείτε να αυξήσετε την ταχύτητα και την ακρίβεια του OCR. Για να ορίσετε αυτούς τους χαρακτήρες, κάντε κλικ στο κουμπί Προηγμένες ρυθμίσεις... στο πλαίσιο διαλόγου Ιδιότητες ομάδας γλωσσών και εισαγάγετε τους απαγορευμένους χαρακτήρες στο πεδίο Απαγορευμένοι χαρακτήρες.
  5. Κάντε κλικ στην επιλογή OK.

Η νέα ομάδα θα εμφανίζεται στην αναπτυσσόμενη λίστα των γλωσσών στην κύρια γραμμή εργαλείων.

Σύμφωνα με τις προεπιλεγμένες ρυθμίσεις, οι ομάδες γλωσσών του χρήστη αποθηκεύονται στο φάκελο του έργου OCR. Μπορείτε επίσης να αποθηκεύσετε όλα τα μοτίβα και τις γλώσσες χρήστη σε ένα αρχείο. Για να το κάνετε αυτό,ανοίξτε το πλαίσιο διαλόγου Επιλογές (κάντε κλικ στην επιλογή Εργαλεία > Επιλογές... για να ανοίξετε το πλαίσιο διαλόγου), κάντε κλικ στην καρτέλα OCR και, στη συνέχεια, κάντε κλικ στο κουμπί Αποθήκευση μοτίβων και γλωσσών....

Συμβουλή. Μπορείτε να χρησιμοποιήσετε την αναπτυσσόμενη λίστα γλωσσών στην κύρια γραμμή εργαλείων για να επιλέξετε μία ομάδα γλωσσών.

  1. Επιλέξτε Περισσότερες γλώσσες... από την αναπτυσσόμενη λίστα γλωσσών στην κύρια γραμμή εργαλείων.
  2. Στο πλαίσιο διαλόγου Επεξεργαστής γλώσσας, επιλέξτε το στοιχείο Μη αυτόματος προσδιορισμός γλωσσών για το OCR.
  3. Επιλέξτε τις γλώσσες που θέλετε και κάντε κλικ στο OK.

11/2/2018 4:19:16 PM


Please leave your feedback about this article