Χαρακτηριστικά εγγράφου που πρέπει να λαμβάνονται υπόψη πριν από την οπτική αναγνώριση χαρακτήρων

Η ποιότητα των εικόνων έχει σημαντικές επιπτώσεις στην ποιότητα της οπτικής αναγνώρισης χαρακτήρων. Σε αυτή την ενότητα περιγράφονται οι παράγοντες που πρέπει να λαμβάνονται υπόψη πριν από την αναγνώριση των εικόνων:

Γλώσσες OCR

Το ABBYY FineReader μπορεί να αναγνωρίσει μονόγλωσσα και πολύγλωσσα έγγραφα (π.χ. γραμμένα σε δύο ή περισσότερες γλώσσες). Για πολύγλωσσα έγγραφα, θα πρέπει να επιλέξετε διάφορες γλώσσες OCR.

Για να επιλέξετε γλώσσες OCR, κάντε κλικ στο κουμπί Επιλογές > Γλώσσες και επιλέξτε μία από τις παρακάτω ρυθμίσεις:

  • Αυτόματη επιλογή γλωσσών για OCR από την παρακάτω λίστα
    Το ABBYY FineReader επιλέγει αυτόματα τις κατάλληλες γλώσσες από τη λίστα γλωσσών που καθορίζονται από τον χρήστη. Για να επεξεργαστείτε τη λίστα των γλωσσών:
    1. Βεβαιωθείτε ότι η επιλογή Αυτόματη επιλογή γλωσσών για OCR από την παρακάτω λίστα είναι ενεργοποιημένη.
    2. Κάντε κλικ στο κουμπί Ορισμός....
    3. Στο πλαίσιο διαλόγου Γλώσσες επιλέξτε τη γλώσσα που επιθυμείτε και κάντε κλικ στο κουμπί OK.
    4. Στο πλαίσιο διαλόγου Επιλογές κάντε κλικ στο κουμπί OK.
  • Μη αυτόματος προσδιορισμός γλωσσών για το OCR
    Επιλέξτε αυτήν τη ρύθμιση, εάν η γλώσσα που χρειάζεστε δεν εμφανίζεται στη λίστα.

Στο παρακάτω πλαίσιο διαλόγου, καθορίστε μία ή περισσότερες γλώσσες. Αν χρησιμοποιείτε έναν συγκεκριμένο γλωσσικό συνδυασμό, μπορείτε να δημιουργήσετε μια νέα ομάδα για αυτές τις γλώσσες.

Εάν μια γλώσσα δεν περιλαμβάνεται στη λίστα, τότε είτε:

  1. Δεν υποστηρίζεται από το ABBYY FineReader, είτε
    Για μια ολοκληρωμένη λίστα των υποστηριζόμενων γλωσσών, ανατρέξτε στην ενότητα Υποστηριζόμενες γλώσσες για οπτική αναγνώριση χαρακτήρων.
  2. Δεν υποστηρίζεται από την έκδοση του προϊόντος σας.
    Μπορείτε να δείτε την πλήρη λίστα των γλωσσών που είναι διαθέσιμες στην έκδοση του προϊόντος σας στο πλαίσιο διαλόγου Άδειες χρήσης (κάντε κλικ στο κουμπί Βοήθεια > Σχετικά > Πληροφορίες Άδειας Χρήσης για να ανοίξετε αυτό το πλαίσιο διαλόγου).

Επιπλέον της χρήσης ενσωματωμένων γλωσσών και ομάδων γλωσσών, μπορείτε να δημιουργήσετε τις δικές σας γλώσσες και ομάδες.Δείτε επίσης: Εάν το πρόγραμμα δεν αναγνωρίζει ορισμένους χαρακτήρες.

Τύπος εκτύπωσης

Τα έγγραφα ενδέχεται να έχουν εκτυπωθεί σε διάφορες συσκευές, όπως γραφομηχανές και συσκευές φαξ. Η ποιότητα της οπτικής αναγνώρισης χαρακτήρων ενδέχεται να διαφέρει ανάλογα με τον τρόπο εκτύπωσης του εγγράφου. Μπορείτε να βελτιώσετε την ποιότητα OCR, επιλέγοντας τον σωστό τύπο εκτύπωσης στο πλαίσιο διαλόγου Επιλογές.

Για τα περισσότερα έγγραφα, το πρόγραμμα θα εντοπίσει αυτόματα τον τύπο εκτύπωσης τους. Για αυτόματο εντοπισμό του τύπου εκτύπωσης, η επιλογή Αυτόματο πρέπει να είναι ενεργοποιημένη στην ομάδα επιλογών Τύπος εγγράφου στο πλαίσιο διαλόγου Επιλογές (κάντε κλικ στο κουμπί Εργαλεία > Επιλογές... > OCR για να αποκτήσετε πρόσβαση σε αυτές τις επιλογές). Μπορείτε να επεξεργαστείτε ένα έγγραφο σε έγχρωμη ή σε ασπρόμαυρη λειτουργία.

Μπορείτε επίσης να επιλέξετε με μη αυτόματο τρόπο τον τύπο εκτύπωσης όπως απαιτείται.

Παράδειγμα δακτυλογραφημένου κειμένου. Όλα τα γράμματα είναι ίδιου πλάτους (συγκρίνετε, για παράδειγμα το "ω" και το "τ"). Για κείμενα αυτού του τύπου, επιλέξτε Γραφομηχανή.
Παράδειγμα κειμένου που παράγεται από μια συσκευή φαξ. Όπως μπορείτε να δείτε στο παράδειγμα, τα γράμματα δεν είναι καθαρά σε ορισμένα σημεία. Επίσης, υπάρχουν παράσιτα και παραμορφώσεις. Για κείμενα αυτού του τύπου, επιλέξτε Φαξ.

Μετά την αναγνώριση δακτυλογραφημένων κειμένων ή φαξ, επιλέξτε Αυτόματο πριν να επεξεργαστείτε συνήθη έντυπα έγγραφα.

Ποιότητα εκτύπωσης

Τα έγγραφα χαμηλής ποιότητας με "παράσιτα" (εμφάνιση τυχαίων μαύρων κουκκίδων ή κηλίδων), με θολωμένα ή ανομοιόμορφα γράμματα ή με παραμορφωμένες γραμμές και μετατοπισμένα περιγράμματα πινάκων ενδέχεται να απαιτούν συγκεκριμένες ρυθμίσεις σάρωσης.

Φαξ Εφημερίδα

Τα κακής ποιότητας έγγραφα σαρώνονται καλύτερα σε κλίμακα του γκρι. Κατά τη σάρωση σε κλίμακα του γκρι, το πρόγραμμα θα επιλέξει τη βέλτιστη τιμή φωτεινότητας αυτόματα.

Η λειτουργία σάρωσης στην κλίμακα του γκρι διατηρεί περισσότερες λεπτομέρειες σχετικά με τα γράμματα στο σαρωμένο κείμενο για καλύτερα αποτελέσματα οπτικής αναγνώρισης χαρακτήρων κατά την αναγνώριση εγγράφων μέτριας ή κακής ποιότητας. Μπορείτε επίσης να διορθώσετε ορισμένα από τις ατέλειες χειροκίνητα χρησιμοποιώντας τα εργαλεία επεξεργασίας εικόνας που είναι διαθέσιμα στον επεξεργαστή εικόνας. Δείτε επίσης: Εάν η εικόνα του εγγράφου σας έχει ατέλειες και η ακρίβεια του OCR είναι χαμηλή.

Έγχρωμη λειτουργία

Εάν δεν θέλετε να διατηρήσετε τα αρχικά χρώματα ενός έγχρωμου εγγράφου, μπορείτε να επεξεργαστείτε το έγγραφο σε ασπρόμαυρη λειτουργία. Με αυτόν τον τρόπο περιορίζεται σημαντικά το μέγεθος του έργου OCR που δημιουργείται και επιταχύνεται η διαδικασία οπτικής αναγνώρισης χαρακτήρων. Ωστόσο, η επεξεργασία εικόνων χαμηλής αντίθεσης σε ασπρόμαυρη λειτουργία μπορεί να οδηγήσει σε χαμηλή ποιότητα οπτικής αναγνώρισης χαρακτήρων. Επίσης, η ασπρόμαυρη επεξεργασία δεν συνιστάται για φωτογραφίες, σελίδες περιοδικών και κείμενα στα Κινεζικά, τα Ιαπωνικά και τα Κορεατικά.

Συμβουλή. Ακόμη, μπορείτε να επιταχύνετε την οπτική αναγνώριση χαρακτήρων έγχρωμων και ασπρόμαυρων εγγράφων επιλέγοντας Γρήγορη αναγνώριση στην καρτέλα OCR του Επιλογές πλαισίου διαλόγου. Για περισσότερες λεπτομέρειες σχετικά με τις λειτουργίες αναγνώρισης, ανατρέξτε στην ενότητα Επιλογές OCR.

Για ορισμένες πρόσθετες συστάσεις σχετικά με την επιλογή της κατάλληλης έγχρωμης λειτουργίας, ανατρέξτε στην ενότητα Συμβουλές σάρωσης.

Από τη στιγμή που το έγγραφο έχει μετατραπεί σε ασπρόμαυρο, δεν θα είστε σε θέση να επαναφέρετε τα χρώματα. Για να δημιουργήσετε ένα έγχρωμο έγγραφο, ανοίξτε ένα αρχείο με τις έγχρωμες εικόνες ή σαρώστε το έντυπο έγγραφο σε έγχρωμη λειτουργία.

11/2/2018 4:19:16 PM


Please leave your feedback about this article