אפשרויות זיהוי תווים אופטי (OCR)

הבחירה באפשרויות נכונות של זיהוי תווים אופטי (OCR) חשובה לקבלה של תוצאות מהירות ומדויקות. בעת קביעת האפשרויות שבהן תרצה להשתמש, עליך להביא בחשבון לא רק את סוג ואת מורכבות המסמך, אלא גם את אופן השימוש המיועד בתוצאות. קבוצות האפשרויות הבאות זמינות:

ניתן למצוא את אפשרויות זיהוי התווים האופטי (OCR) בכרטיסייה OCR של תיבת הדו-שיח Options (לחץ על Tools > Options... כדי לפתוח תיבת דו-שיח זו).

ABBYY FineReader מזהה באופן אוטומטי כל עמוד שאתה מוסיף לפרויקט של זיהוי תווים אופטי (OCR). בזיהוי תווים אופטי (OCR), המערכת תשתמש באפשרויות הנבחרות הנוכחיות. ניתן לבטל ניתוח וזיהוי תווים אופטי (OCR) אוטומטיים של תמונות חדשות שנוספו בכרטיסייה Image Processing של תיבת הדו-שיח Options (לחץ על Tools > Options... כדי לפתוח תיבת דו-שיח זו).

אם תשנה את האפשרויות של זיהוי תווים אופטי (OCR) לאחר זיהוי המסמך, הפעל שוב את תהליך זיהוי התווים האופטי (OCR) כדי לזהות את המסמך עם האפשרויות החדשות.

מצבי זיהוי PDF

הגדרות אלו מיועדות למסמכי PDF המכילים שכבות טקסט ותמונות. מסמכי PDF אלה נוצרים בדרך כלל ממסמכים בתבניות ניתנות לעריכה. סוגים אחרים של מסמכי PDF, כגון מסמכי PDF ניתנים לחיפוש ומסמכי PDF שהם תמונה בלבד, תמיד מעובדים במצב Use OCR, שהוא מצב ברירת המחדל עבור סוגים אלה של PDF. אין צורך בשום הגדרות נוספות לעיבוד מסמכי PDF מעין אלה.

שלושה מצבי זיהוי זמינים:

  • Automatically Choose between OCR and Text from PDF
    התוכנית תבדוק את שכבת הטקסט, ותשתמש בשכבת הטקסט הקיימת אם היא מכילה טקסט באיכות טובה. אם לא, המערכת תשתמש בזיהוי תווים אופטי (OCR) כדי ליצור שכבת טקסט חדשה.
  • Use OCR
    המערכת תשתמש בזיהוי תווים אופטי (OCR) כדי ליצור שכבת טקסט חדשה. מצב זה נמשך זמן רב יותר, אך הוא יותר מתאים למסמכים עם שכבות טקסט באיכות ירודה.
  • Use Only Text from PDF
    זהו מצב ברירת המחדל עבור מסמכי PDF עם שכבות טקסט. התוכנית תשתמש בשכבת הטקסט המקורית ללא הפעלת זיהוי תווים אופטי (OCR).

איזון בין מהירות לבין דיוק של זיהוי תווים אופטי (OCR)

ABBYY FineReader 14 מאפשר לך לבצע:

  • Thorough recognition
    במצב זה, ABBYY FineReader מנתח ומזהה גם מסמכים פשוטים וגם מסמכים עם פריסות מורכבות, אפילו כאלה המכילים טקסט המודפס על רקע צבעוני ומסמכים עם טבלאות מורכבות (בכלל זה טבלאות עם קווי רשת לבנים וטבלאות עם תאים צבעוניים). עבור
    Thorough recognition נדרש יותר זמן אך התוצאה שמתקבלת טובה יותר.
  • Fast recognition
    מצב זה מומלץ לעיבוד מסמכים גדולים עם פריסות פשוטות ותמונות באיכות טובה.

סוג הדפסה

מציין את סוג המכשיר המשמש להדפסת המסמך. ראה גם: תכונות מסמך שיש להביא בחשבון לפני זיהוי תווים אופטי (OCR).

זיהוי אלמנטים מבניים

בחר את האלמנטים המבניים שתרצה שהתוכנית תזהה: כותרות עליונות ותחתונות, הערות שוליים, תוכן עניינים ורשימות. לאחר שמירת המסמך, ניתן יהיה ללחוץ על האלמנטים שנבחרו.

ברקודים

אם המסמך מכיל ברקודים, וברצונך להמיר אותם למחרוזות של אותיות וספרות במקום לשמור אותם כתמונה, בחר באפשרות Convert barcodes into strings. כברירת מחדל, תכונה זו מושבתת.

תבניות ושפות

המערכת משתמשת בזיהוי עם תרגול לזיהוי סוגי הטקסט הבאים:

  • טקסטים עם סמלים מיוחדים (לדוגמה, סימנים מתמטיים)
  • טקסט עם אלמנטים קישוטיים
  • נפח גדול של טקסט מתמונות באיכות נמוכה (מעל ל-100 עמודים)

כברירת מחדל, התרגול מושבת. הפעל את Use training to recognize new characters and ligatures כדי לתרגל את ABBYY FineReader במהלך ביצוע של זיהוי תווים אופטי (OCR).

ניתן להשתמש בתבניות מוכללות או בתבניות משלך לזיהוי.

ניתן לשמור ולטעון הגדרות עבור תבניות ושפות של משתמש. ראה גם: פרויקט של זיהוי תווים אופטי (OCR).

גופנים

כאן ניתן לבחור את הגופנים לשימוש בעת שמירת טקסט מזוהה.

כדי לבחור גופנים:

  1. לחץ על הלחצן Select Fonts....
  2. בחר את הגופנים הרצויים, ולחץ על OK.

02.11.2018 16:19:24


Please leave your feedback about this article