Сохранение в архив

В современном мире все чаще возникает проблема организации большого массива данных, хранящихся на бумаге. Решением может служить создание электронного архива документов. Электронный архив обеспечивает легкий доступ к документам, быстрый поиск информации, длительное хранение без потери качества, компактность и надежность хранения. Основным форматом для долгосрочного хранения архивных документов является PDF/A.

PDF/A - это подмножество формата PDF из которого исключены некоторые особенности, например, запрещено шифрование, аудио- и видео-контент, ссылки на внешние источники и др. Эти ограничения обеспечивают самодостаточность формата, т.е. вся информация, необходимая для того, чтобы каждый раз отображать документ в неизменном виде, содержится в файле.

Замечание. Для хранения архивов вы также можете использовать формат DjVu. Обычно он используется для документов, содержащих много картинок, схем, формул. Подробнее о параметрах сохранения в это формат см. в статье "Сохранение электронных книг".

Сохранение в формат PDF/A

Выберите формат сохранения PDF/A, если вы хотите создать PDF документ с возможностью поиска по тексту и без потери визуального качества, и если данный документ в дальнейшем будет храниться в архиве.

Как сохранить текст в формат PDF/A:

  • Нажмите на стрелку возле кнопки сохранения результатов  на главной панели инструментов и выберите из списка формат сохранения. Если нужного формата в списке нет, выберите пункт Сохранить в других форматах…, и в открывшемся диалоге сохранения выберите требуемый формат. Вы также можете сохранить документы, используя команду меню Файл>Сохранить документ как>Документ PDF/A.

Совет. В случае необходимости вы можете настроить дополнительные опции сохранения на закладке Сохранить>PDF/А диалога Настройки (меню Сервис>Настройки…).

Данная закладка содержит следующие группы настроек:

Размер бумаги по умолчанию

Вы можете указать размер бумаги, который будет использован при сохранении результатов распознавания в формат PDF.

Режим сохранения

Выбор режима сохранения зависит от того, как вы будете использовать созданный документ в дальнейшем:

  • Только текст и картинки

В данном режиме сохраняются распознанный текст и иллюстрации. PDF-файл такого типа имеет относительно небольшой размер, и в нем возможен полнотекстовый поиск. Внешний вид документа может незначительно отличаться от оригинала.

  • Текст поверх изображения страницы

В данном режиме сохраняются фон и иллюстрации исходного документа, на них накладывается распознанный текст. Обычно размер такого PDF-файла больше, чем файла, получаемого при сохранении в режиме Только текст и картинки. В PDF-документе этого типа есть возможность полнотекстового поиска, однако внешний вид документа может незначительно отличаться от оригинала.

  • Текст под изображением страницы

В данном режиме сохраняется изображение страницы, распознанный текст помещается на невидимый слой под изображением. Таким образом, получается документ с возможностью поиска по тексту, при этом внешний вид PDF-документа практически неотличим от оригинала.

  • Только изображение

В данном режиме сохраняется изображение страницы. Внешний вид полученного PDF-документа будет не отличим от оригинала, однако в таком документе невозможен поиск по тексту.

В зависимости от выбранного режима сохранения будут доступны следующие опции:

  • Сохранять цвет фона и букв

Указывает, что при сохранении текста в формат PDF будет сохранен цвет букв и фона.

  • Сохранять колонтитулы

Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов был сохранен. Если данная опция отключена, текст колонтитулов сохраняться не будет.

  • Создать оглавление

Отметьте эту опцию, если вы хотите создать в PDF-документе оглавление на основе структуры документа.

  • Разрешить теги PDF

Указывает, что при сохранении распознанного текста в формате PDF будут автоматически сохранены теги PDF.

Помимо текста и иллюстраций PDF-файлы могут содержать информацию о структуре документа: логических частях, иллюстрациях и таблицах. Эта информация хранится в виде тегов PDF. Теги PDF обеспечивают удобство просмотра документа на экранах различного размера, например, на экранах карманных компьютеров.

  • Использовать смешанное растровое содержание (MRC)

Отметьте эту опцию, если вы хотите, чтобы при сильном сжатии документа сохранилось высокое качество текста и изображений. В результате размер конечного файла будет небольшим, а качество текста и иллюстраций будет высоким.

  • Применить технологию ABBYY PreciseScan для сглаживания символов на изображениях

Отметьте эту опцию, чтобы применить технологию PreciseScan, разработанную компанией ABBYY. ABBYY PreciseScan сглаживает символы документа, в результате при увеличении масштаба страницы не возникает эффекта пикселизации.

Качество изображения

Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Качество картинок и размер полученного файла зависят от выбранного значения в выпадающем списке группы Качество изображения:

  • Высокое (разрешение исходного изображения)

Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.

  • Сбалансированное

Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.

  • Небольшой размер

Отметьте эту опцию, если вы хотите получить PDF-документ небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 300 dpi, что повлияет на их качество.

  • Пользовательское…

Выберите этот пункт для того чтобы задать параметры сохранения изображения и иллюстраций. В открывшемся диалоговом окне Пользовательские настройки выберите необходимые значения и нажмите кнопку ОК.

Совет. Если вы не хотите сохранять иллюстрации в распознанном тексте, убедитесь, что опция Сохранять картинки не отмечена.

1/14/2020 5:26:21 PM


Please leave your feedback about this article