אפשרויות עיבוד תמונה

כדי להתאים אישית את הסריקה ואת הפתיחה של עמודים ב-ABBYY FineReader, באפשרותך:

ניתן לבחור את האפשרויות הרצויות בעת פתיחת מסמך PDF, תמונות או סריקות בחלון 'משימה חדשה'. לחלופין, ניתן לעשות זאת בכרטיסייה Image Processing של תיבת הדו-שיח Options (לחץ על Tools > Options... כדי לפתוח תיבת דו-שיח זו).

שינויים שתבצע בתיבת הדו-שיח Options יחולו רק על תמונות חדשות שנסרקו/נפתחו.

הכרטיסייה Image Processing של תיבת הדו-שיח Options מכילה את האפשרויות הבאות:

הפעלת זיהוי רקע בעורך PDF

ייעשה שימוש בזיהוי רקע עבור כל העמודים שתפתח בעורך PDF. זיהוי רקע מאפשר לך לחפש ולהעתיק טקסט גם במסמכים שאין להם שכבת טקסט (למשל, מסמכים שמכילים סריקות בלבד או שנוצרו מתמונות). לא יבוצעו שינויים קבועים במסמך עצמו.

בכרטיסייה זו ניתן גם לציין את שפות זיהוי התווים האופטי (OCR).

אם תרצה לאפשר למשתמשים נוספים לבצע חיפושי טקסט במסמך זה, לחץ על File > Recognize Document > Recognize Document....

ניתוח וזיהוי אוטומטיים של תמונות שנוספו לעורך זיהוי התווים האופטי (OCR)

כברירת מחדל, העמודים מנותחים ומזוהים באופן אוטומטי, אך ניתן לשנות אפשרות זו. המצבים הבאים זמינים:

  • Recognize page images (includes preprocessing and analysis)
    כאשר תמונות נפתחות בעורך זיהוי התווים האופטי (OCR), הן יעברו עיבוד מקדים באופן אוטומטי באמצעות ההגדרות שנבחרו בקבוצת ההגדרות Image preprocessing settings. ניתוח וזיהוי תווים אופטי (OCR) מבוצעים גם הם באופן אוטומטי.
  • Analyze page images (includes preprocessing)
    ניתוח מקדים של תמונה וניתוח מסמך מבוצעים באופן אוטומטי, אך יש להפעיל באופן ידני את זיהוי התווים האופטי (OCR).
  • Preprocess page images
    רק עיבוד מקדים מבוצע באופן אוטומטי. יש להתחיל ניתוח וזיהוי תווים אופטי (OCR) באופן ידני. מצב זה משמש בדרך כלל עבור מסמכים עם מבנים מורכבים.

אם אינך מעוניין לעבד באופן אוטומטי את התמונות שאתה מוסיף, נקה את האפשרות Automatically process page images as they are added to the OCR Editor.

כך ניתן לפתוח במהירות מסמכים גדולים, לזהות רק עמודים נבחרים במסמך ולשמור מסמכים כתמונות.

הגדרות עיבוד מקדים לתמונה

ABBYY FineReader מאפשר לך לתקן באופן אוטומטי פגמים נפוצים בסריקות ובתמונות דיגיטליות.

כברירת מחדל, תיבת דו-שיח זו מציגה שלוש אפשרויות מומלצות:

  • Split facing pages
    פיצול עמודים צמודים. התוכנית תפצל באופן אוטומטי תמונות המכילות עמודים צמודים לשתי תמונות, המכילות עמוד אחד כל אחת.
  • Correct page orientation
    התוכנית תזהה באופן אוטומטי (ותתקן לפי הצורך) את כיוון העמודים שנוספים לפרויקט של זיהוי תווים אופטי (OCR).
  • Use recommended settings for better OCR
    התוכנית תבחר ותחיל באופן אוטומטי את ההגדרות הנדרשות לעיבוד מקדים.

כדי להציג את כל ההגדרות, לחץ על Show Advanced Settings:

  • Deskew images
    התוכנית תזהה באופן אוטומטי עמודים מוטים, ותתקן הטיות לפי הצורך.
  • Straighten text lines
    התוכנית תזהה באופן אוטומטי שורות טקסט לא אחידות בתמונות, ותיישר אותן מבלי לתקן עיוותי טרפז.
  • Correct image resolution
    התוכנית תזהה ותקבע באופן אוטומטי את הרזולוציה הטובה ביותר עבור תמונות, והיא תשנה את הרזולוציה של התמונות לפי הצורך.
  • Detect page edges *
    התוכנית תזהה ותחתוך קצוות תמונה באופן אוטומטי.
  • Whiten background *
    התוכנית תבהיר רקעים באופן אוטומטי, ותבחר את הגדרת הבהירות הטובה ביותר.
  • Reduce ISO noise *
    התוכנית תסיר באופן אוטומטי רעש מצילומים.
  • Remove motion blur *
    התוכנית תגביר את החדות של תמונות דיגיטליות מטושטשות.
  • Correct trapezoid distortions *
    התוכנית תזהה באופן אוטומטי עיוותי טרפז ושורות טקסט לא אחידות בצילומים דיגיטליים ובסריקות של ספרים.
  • Fix inverted colors on image
    לפי הצורך, התוכנית תהפוך צבעי תמונה כך שטקסט כהה יודפס על רקע בהיר.
  • Convert to black and white
    התוכנית תמיר תמונות בצבע לתמונות בשחור-לבן. תהליך זה יקטין משמעותית את הפרויקט הנוצר של זיהוי תווים אופטי (OCR), ויאיץ את זיהוי התווים האופטי. לא מומלץ להשתמש בהמרה לשחור-לבן במקרה של תמונות, עמודי מגזינים וטקסטים בסינית, יפנית וקוריאנית.
  • Remove color marks
    התוכנית תזהה ותסיר חותמות צבע וסימונים שנעשו באמצעות עט, כדי להקל על זיהוי הטקסט שסימונים אלה מסתירים. אפשרות זו מיועדת למסמכים סרוקים עם טקסט כהה המודפס על רקע לבן. אל תבחר באפשרות זו עבור תמונות דיגיטליות ועבור מסמכים עם רקעים צבעוניים.

* עבור תמונות דיגיטליות בלבד.

כדי להציג את ההגדרות המומלצות בלבד, לחץ על Hide Advanced Settings.

ניתן להשבית את כל האפשרויות הללו בעת סריקה או פתיחה של עמודי מסמך ועדיין להחיל עיבוד מוקדם רצוי בעורך התמונות של עורך זיהוי התווים האופטי (OCR). ראה גם: אם תמונת המסמך מכילה פגמים ורמת דיוק נמוכה של זיהוי תווים אופטי (OCR).

02.11.2018 16:19:24


Please leave your feedback about this article