Russian (Русский) - Change language

Параметры обработки изображений

При добавлении изображений в пакет производится их предварительная обработка: деление изображений по документам, очищение, поворот изображений. При необходимости можно настроить более сложную обработку, например, включить автоматическую обрезку изображения, удаление цветных пометок и т.д. Для специфических изображений плохого качества можно настроить и автоматически применять специальные профили улучшения изображений.

Редактирование изображений применяется с целью исправления возможных погрешностей изображения, в первую очередь - при обработке фотографий документов (в том числе с мобильных устройств) и сканов документов со сложным фоном, затрудняющим распознавание и извлечение данных (например, сертификаты, паспорта, и т.п.). Данный этап позволяет повысить качество результатов распознавания для изображений низкого качества.

Параметры обработки изображений задаются в диалоге (на вкладке) Обработка изображений. Их можно задать:

  1. Для проекта. Тогда они будут использоваться по умолчанию при ручном добавлении изображений в пакеты проекта. Для этого в главном окне программы выберите пункт меню Проект → Свойства проекта... и в открывшемся диалоге перейдите на вкладку Обработка изображений.
  2. Для профиля импорта. Эти параметры будут использоваться при добавлении изображений с помощью данного профиля импорта. Для этого при создании профиля импорта изображения задайте параметры обработки изображений на шаге Обработка изображений.
  3. Для изображений, добавляемых вручную. Для этого при добавлении изображений страниц из файла нажмите на кнопку Параметры обработки изображений... в диалоге Загрузка изображений.
    Замечание. При сканировании вручную предварительная обработка изображений не осуществляется.
  4. Для типа пакета. Тогда они будут использоваться для обработки изображений пакетов данного типа. Для этого при создании типа пакета задайте необходимые параметры на шаге Обработка изображений. Настройки, указанные для типа пакета, также применяются к изображениям:
    • полученным со Станции Сканирования или Веб-станции Сканирования, в случае если они не были собраны в документы на соответствующей станции. Настройки из группы Обработка изображений будут применяться к полученным изображениям независимо от того, собраны изображения в документы или нет;
    • добавленным с помощью методов программного интерфейса (API), в случае если флаг ExcludeFromAutomaticAssembling имеет значение false. Подробнее смотрите в справке программного интерфейса (API);
    • добавленным из горячей папки (если отмечена опция Использовать настройки обработки изображений типа пакетов). Подробнее см. Профили импорта изображений;
    • добавленным вручную из файла. В этом случае опции, указанные для типа пакета, используются по умолчанию.

Пользователь может определить следующие параметры предварительной обработки изображений:

  • Удалять пустые страницы - отметьте эту опцию, чтобы пустые страницы не попадали в обработку.
  • Опции для добавления изображений в документы:
    • Автоматически при наложении определения документа – отметьте эту опцию, если вы хотите, чтобы изображения собирались в документы при наложении определения документа (при распознавании). В этом случае при добавлении изображений документы формироваться не будут, они соберутся по результатам анализа страниц при распознавании согласно структуре, описанной для данного определения документа. Подробнее см. Создание определений для многостраничных документов и Сборка страниц в документы.
    • Для каждого файла – новый документ будет создан для каждого файла (файл изображения может быть многостраничным).
    • Для изображений, разделенных специальной страницей – страницы будут добавляться в один документ, пока не встретится страница-разделитель, тогда будет создан следующий документ и страницы будут добавляться в него и т.д. В качестве разделителя могут быть использованы пустые страницы, в этом случае выберите пустыми страницами в выпадающем списке. В открывшемся диалоге Настройки определения пустых страниц укажите параметры, по которым будет определяться пустая страница. Также можно использовать в качестве разделителя страницы со штрих-кодами, в этом случае выберите страницами со штрих-кодом. Для штрих-кодов или пустых страниц можно задать дополнительные параметры, для этого нужно нажать кнопку Настройки... Обратите внимание, что при выставлении какого-либо значения штрих-кода идентификатор документа в пакете будет меняться на это значение. Если страницы-разделители не нужно добавлять в пакет, то отметьте опцию Удалять страницу-разделитель. Если она не будет отмечена, страницы-разделители добавляются в пакет и становятся первыми страницами каждого документа.
      Замечание. Страницы-разделители для определения разбивки по документам использовать не обязательно. Без них нельзя обойтись только в одном случае: когда по виду страницы невозможно определить, относится она к предыдущему документу, или к следующему. Например, когда документ состоит из произвольного количества одинаковых страниц, а в пакете может присутствовать более одного такого документа.
      Замечание. Для изображений, отсканированных или добавленных на Станции Сканирования, параметры разделения документов и пакетов указываются в настройках типа пакета на Станции Сканирования.
  • Опции обработки поступающих изображений:
    • Базовая обработка изображений - использовать базовые преобразования изображений. Рекомендуется использовать для изображений приемлемого качества, не требующих более сложной обработки.

      Настройки

    • Использовать профиль улучшения изображения - применять для изображений специально настроенный профиль улучшения изображений. Рекомендуется использовать для специфических изображений в однородном или смешанном потоке, требующих более сложного комплекса средств по редактированию.
      Если в смешанном потоке изображений планируется обработка фотографий, требующих отличного от основного профиля набора средств, отметьте опцию Использовать для фотографий специальный профиль и выберите второй профиль.
    • Сохранять исходное изображение во время обработки - данная опция позволяет сохранять исходные изображения в файловом хранилище. Дает возможность вернуться к оригиналу изображения, если с результате применения автоматических средств обработки были удалены важные данные.
      Замечание. Сохранение оригиналов изображений влечет за собой увеличение места, занимаемого проектом, и, как следствие, замедление процесса обработки. Поэтому включение данной опции рекомендуется только в том случае, если возврат к оригинальному изображению необходим.
  • Опции обработки файлов PDF:
    • Автоматический выбор между распознаванием и текстовым слоем PDF – будет автоматически выбран оптимальный вариант обработки файла в зависимости от наличия и качества текстового слоя документа PDF.
    • Всегда использовать текстовый слой PDF, если он доступен – будет использован текстовый слой из документа PDF.
    • Использовать только распознавание – будет выполнено распознавание документа вне зависимости от наличия текстового слоя в документе.
  • Опции предобработки файлов офисных форматов. Помимо импорта изображений документов для обработки возможен импорт файлов офисных форматов, которые преобразуются в PDF-формат с помощью встроенного инструмента.
    Для использования сторонних приложений отметьте опции:
    Замечание. Результаты обработки могут отличаться в зависимости от выбранного приложения, см. Примечания.
    • Разрешать использование LibreOffice® - использовать для преобразования приложение LibreOffice (поддерживаемые версии 4.2, 4.3, 4.4 и 5).
    • Разрешать использование Microsoft® Office - использовать для преобразования приложение Microsoft Office (поддерживаемые версии 2010, 2013 и 2016)

В одном потоке документов допускается наличие как сканированных изображений документов, так и файлов офисных форматов (см. Поддерживаемые входные форматы).

Примечания:

  • При импорте из почты "тело" письма также может выступать в качестве документа.
  • Если отмечены обе опции предобработки файлов офисных форматов, программа автоматически выберет подходящее решение, что будет зафиксировано в логе задачи.
  • Преобразование с помощью сторонних приложений может быть выполнено только при условии, что данное приложение установлено на одной машине со Станцией Обработки, выполняющей импорт.
  • В случае преобразования с помощью приложения Microsoft Office:
    • приложение должно быть активировано;
    • преобразование может быть выполнено только из-под учетной записи пользователя с правами администратора на машине, на которой осуществляется преобразование. Чтобы открыть диалог настроек аутентификации, нажмите кнопку Аутентификация....

14.01.2021 14:17:24


Please leave your feedback about this article