תכונות מסמך שיש להביא בחשבון לפני זיהוי תווים אופטי (OCR)

לאיכות התמונות יש השפעה משמעותית על איכות זיהוי התווים האופטי (OCR). פרק זה מסביר אילו גורמים יש להביא בחשבון לפני זיהוי התמונות.

שפות של זיהוי תווים אופטי (OCR)‏

ABBYY FineReader מסוגל לזהות מסמכים בשפה אחת ומסמכים בשפות מרובות (כלומר, הכתובים בשתי שפות או יותר). במקרה של מסמכים בשפות מרובות, עליך לבחור כמה שפות של זיהוי תווים אופטי (OCR)‏.

כדי לבחור שפות של זיהוי תווים אופטי (OCR)‏, לחץ על Options >  Languages, ובחר באחת מהאפשרויות הבאות:

  • Automatically select OCR languages from the following list
    ABBYY FineReader יבחר באופן אוטומטי את השפות המתאימות מרשימת השפות המוגדרת על-ידי המשתמש. כדי לערוך את רשימת השפות:
    1. ודא שהאפשרות Automatically select OCR languages from the following list נבחרה.
    2. לחץ על הלחצן Specify....
    3. בתיבת הדו-שיח Languages, בחר בשפות הרצויות, ולחץ על OK.
    4. בתיבת הדו-שיח Options, לחץ על אישור.
  • Specify OCR languages manually
    בחר באפשרות זו אם השפה הרצויה לא נמצאת ברשימה.

בתיבת הדו-שיח שלמטה, ציין לפחות שפה אחת. אם אתה משתמש בשילוב שפות מסוים לעתים תכופות, תוכל ליצור קבוצה חדשה עבור שפות אלו.

אם שפה מסוימת לא נמצאת ברשימה:

  1. השפה אינה נתמכת ב-ABBYY FineReader. לחלופין,
    לרשימה מלאה של השפות הנתמכות, עיין בדף שפות נתמכות של זיהוי תווים אופטי (OCR)‏.
  2. היא לא נתמכת בגרסת המוצר שברשותך.
    ניתן למצוא את רשימת השפות הזמינות המלאה בגרסת המוצר שברשותך בתיבת הדו-שיח רישיונות (לחץ על Help > About > License Info כדי לפתוח תיבת דו-שיח זו).

בנוסף לשימוש בשפות מוכללות ובקבוצות של שפות, ניתן ליצור שפות וקבוצות משלך.ראה גם: אם התוכנית לא מצליחה לזהות תווים מסוימים.

סוג הדפסה

ניתן להדפיס מסמכים באמצעות מגוון מכשירים, כגון מכונות כתיבה ומכשירי פקס. איכות זיהוי התווים האופטי (OCR)‏ עשויה להשתנות בהתאם לאופן שבו הודפס המסמך. ניתן לשפר את האיכות של זיהוי התווים האופטי (OCR)‏ על-ידי בחירה בסוג ההדפסה הנכון בתיבת הדו-שיח Options.

עבור רוב המסמכים, התוכנית תזהה את סוג ההדפסה באופן אוטומטי. לזיהוי אוטומטי של סוג הדפסה, יש לבחור את האפשרות Auto בקבוצת האפשרויות Document type בתיבת הדו-שיח Options (לחץ על Tools > Options...>OCR כדי לגשת לאפשרויות אלו). ניתן לעבד מסמכים במצב 'צבע מלא' או במצב 'שחור-לבן'.

ניתן גם לבחור ידנית את סוג ההדפסה בהתאם לצורך.

דוגמה לטקסט שהוקלד במכונת כתיבה. כל האותיות ברוחב שווה (השווה, לדוגמה, את האות 'w' עם האות 't'). עבור טקסטים מסוג זה, בחר באפשרות Typewriter.
דוגמה לטקסט שהודפס במכשיר פקס. כפי שניתן לראות מהדוגמה, האותיות לא ברורות בחלק מהמקומות. קיימים גם רעש ועיוות. עבור טקסטים מסוג זה, בחר באפשרות Fax.

לאחר זיהוי טקסטים שהוקלדו במכונת כתיבה או שהודפסו במכשיר פקס, יש לבחור את האפשרות Auto לפני עיבוד מסמכים שהודפסו באופן רגיל.

איכות הדפסה

לעתים יש צורך בהגדרות סריקה ספציפיות עבור מסמכים באיכות לקויה המכילים "רעש" (למשל, נקודות שחורות או כתמים אקראיים), אותיות מטושטשות ולא אחידות או שורות מוטות וגבולות טבלה מוסטים.

פקס עיתון

מסמכים באיכות לקויה נסרקים בצורה הטובה ביותר בגווני אפור. בעת סריקה בגווני אפור, התוכנית תבחר באופן אוטומטי את ערך הבהירות המיטבי.

מצב הסריקה 'גווני אפור' שומר יותר מידע על האותיות בטקסט הסרוק, כדי להשיג תוצאות טובות יותר של זיהוי תווים אופטי (OCR) בעת זיהוי של מסמכים באיכות בינונית או לקויה. ניתן גם לתקן ידנית חלק מהפגמים באמצעות כלי עריכת התמונה הזמינים בעורך התמונה. ראה גם: אם תמונת המסמך מכילה פגמים ורמת דיוק נמוכה של זיהוי תווים אופטי (OCR).

מצב צבעים

אם אינך צריך לשמר את הצבעים המקוריים של מסמך בצבע מלא, ניתן לעבד את המסמך במצב 'שחור-לבן'. בחירה זו תקטין מאוד את הפרויקט הנוצר של זיהוי תווים אופטי (OCR), ותזרז את תהליך זיהוי התווים האופטי. עם זאת, עיבוד תמונות שהניגודיות שלהן נמוכה בשחור-לבן עלול להוביל לאיכות לקויה של זיהוי תווים אופטי (OCR)‏. כמו כן, לא מומלץ להשתמש בעיבוד שחור-לבן במקרה של צילומים, עמודי מגזינים וטקסטים בסינית, יפנית וקוריאנית.

עצה. ניתן גם להגביר את קצב זיהוי התווים האופטי (OCR) של מסמכים בצבע ושל מסמכים בשחור-לבן על-ידי בחירה באפשרות Fast recognition בכרטיסייה OCR של תיבת הדו-שיח Options. למידע נוסף על מצבי זיהוי, עיין בדף אפשרויות זיהוי תווים אופטי (OCR).

להמלצות נוספות בנושא בחירת מצב הצבעים הנכון, עיין בדף עצות לסריקה.

לאחר שהמסמך יומר לשחור-לבן, לא תוכל לשחזר את הצבעים. לקבלת מסמך צבעוני, פתח קובץ עם תמונות צבעוניות, או סרוק מסמך נייר במצב צבעים.

11/2/2018 4:19:24 PM


Please leave your feedback about this article