Збереження в архів

У сучасному світі все частіше виникає проблема організації великого масиву даних, що зберігаються на папері. Рішенням може слугувати створення електронного архіву документів. Електронний архів забезпечує легкий доступ до документів, швидкий пошук інформації, тривале зберігання без втрати якості, компактність і надійність зберігання. Основним форматом для довгострокового зберігання архівних документів є PDF/A.

PDF/A — це підмножина формату PDF з якого вилучені деякі особливості, наприклад, заборонено шифрування, аудіо- та відеоконтент, посилання на зовнішні джерела тощо. Ці обмеження забезпечують самодостатність формату, тобто вся інформація, необхідна для того, щоб кожен раз відображати документ в незмінному вигляді, міститься у файлі.

Примітка. Для зберігання архівів ви також можете використовувати формат DjVu. Зазвичай він використовується для документів, що містять багато зображень, схем, формул. Докладніше про параметри збереження в цей формат див. у статті «Збереження електронних книг».

Збереження у формат PDF/A

Виберіть формат збереження PDF/A, якщо ви хочете створити PDF-документ із можливістю пошуку у тексті і без втрати візуальної якості, а також якщо цей документ надалі буде зберігатися в архіві.

Як зберегти текст у формат PDF/A:

  • Натисніть на стрілку біля кнопки збереження результатів на головній панелі інструментів і виберіть зі списку формат збереження. Якщо потрібного формату в списку немає, виберіть пункт Зберегти в інші формати…, і в діалозі збереження, що відкрився, виберіть потрібний формат. Ви також можете зберегти документи, використовуючи команду меню Файл>Зберегти документ як>Документ PDF/A.

Порада. У разі потреби ви можете налаштувати додаткові опції збереження на закладці Зберегти>PDF/А діалогу Налаштування (меню Сервіс>Налаштування…).

Ця закладка містить такі групи налаштувань:

Розмір паперу стандартний

Ви можете вказати розмір паперу, який буде використано під час збереження результатів розпізнавання у формат PDF.

Режим збереження

Вибір режиму збереження залежить від того, як ви будете використовувати створений документ надалі:

  • Тільки текст і зображення

У цьому режимі зберігаються розпізнаний текст та ілюстрації. PDF-файл такого типу має відносно невеликий розмір, і в ньому можливий повнотекстовий пошук. Зовнішній вигляд документа може несуттєво відрізнятися від оригіналу.

  • Текст на зображенні

У цьому режимі зберігаються фон та ілюстрації вихідного документа, на них накладається розпізнаний текст. Зазвичай розмір такого PDF-файлу більший, ніж файлу після збереження в режимі Тільки текст і зображення. У PDF-документі цього типу є можливість повнотекстового пошуку, однак зовнішній вигляд документа може несуттєво відрізнятися від оригіналу.

  • Текст під зображенням

У цьому режимі зберігається зображення сторінки, розпізнаний текст розміщується на невидимий шар під зображенням. Таким чином, отримуємо документ з можливістю пошуку в тексті, тоді як зовнішній вигляд PDF-документа майже не відрізняється від оригіналу.

  • Тільки зображення сторінки

У цьому режимі зберігається зображення сторінки. Зовнішній вигляд отриманого PDF-документа не буде відрізнятися від оригіналу, однак у такому документі неможливий пошук у тексті.

Залежно від вибраного режиму збереження будуть доступні такі опції:

  • Зберігати колір фону і літер

Вказує, що під час збереження тексту у формат PDF буде збережено колір літер і фону.

  • Зберігати колонтитули

Позначте цю опцію, якщо хочете, щоб текст колонтитулів було збережено. Якщо ця опція відключена, текст колонтитулів зберігатися не буде.

  • Створити зміст

Позначте цю опцію, якщо хочете створити в PDF-документі зміст на основі структури документа.

  • Дозволити теги PDF

Вказує, що під час збереження розпізнаного тексту у форматі PDF будуть автоматично збережені теги PDF.

Окрім тексту та ілюстрацій PDF-файли можуть містити інформацію про структуру документа: логічні частини, ілюстрації і таблиці. Ця інформація зберігається у вигляді тегів PDF. Теги PDF забезпечують зручність перегляду документа на екранах різного розміру, наприклад, на екранах кишенькових комп’ютерів.

  • Використовувати змішаний растровий вміст (MRC)

Позначте цю опцію, якщо ви хочете, щоб під час сильного стиснення документа збереглася висока якість тексту та зображень. У результаті розмір кінцевого файлу буде невеликим, а якість тексту та ілюстрацій буде високою.

  • Застосувати технологію ABBYY PreciseScan для вирівнювання символів на зображеннях

Позначте цю опцію, щоб застосувати технологію PreciseScan, розроблену компанією ABBYY. ABBYY PreciseScan згладжує символи документа, в результаті після збільшення масштабу сторінки не виникає ефекту пікселізації.

Якість зображення

Якщо розпізнаний текст містить велику кількість ілюстрацій або ви обрали режим, у якому зберігається зображення сторінки, то розмір кінцевого файлу може бути дуже великим. Якість зображень і розмір отриманого файлу залежать від вибраного значення у спадному списку групи Якість зображення:

  • Висока (роздільна здатність вихідного зображення)

Позначте цю опцію, якщо вам важливо зберегти якість зображення сторінки або ілюстрацій. Їх буде збережено з роздільною здатністю вихідного зображення.

  • Збалансоване

Позначте цю опцію, щоб зменшити розмір документа в порівнянні з вихідним, але при цьому зберегти достатньо високу якість зображення сторінки чи ілюстрацій.

  • Невеликий розмір

Позначте цю опцію, якщо хочете отримати PDF-документ невеликого розміру. Роздільну здатність зображення сторінки та ілюстрацій буде зменшено до 300 dpi, що вплине на їхню якість.

  • Інше…

Виберіть цей пункт, щоб задати параметри збереження зображення та ілюстрацій. У діалоговому вікні Параметри збереження, що відкрилося, виберіть потрібні значення і натисніть кнопку ОК.

Порада. Якщо ви не хочете зберігати ілюстрації у розпізнаному тексті, переконайтеся, що опцію Зберігати зображення не позначено.

1/14/2020 5:26:22 PM


Please leave your feedback about this article