Russian (Русский) - Change language

Обучение NLP-модели

После публикации определения документа закройте окно Определения документов, перейдите в раздел Пакеты обучения извлечения полей и создайте новый пакет документов.

  1. Откройте меню Файл и выберите пункт Новый пакет.
  2. В открывшемся окне выберите определение документа и раздел, для которых ранее были настроены поля. Нажмите ОК.
  3. В окне Поиск разновидности для пакета обучения выберите разновидность, для которой будет производиться обучение.
  4. Выделите созданный пакет и выберите опцию NLP-пакет или нажмите Обучение поиску полей > NLP-пакет.

    Опция NLP-пакет

Теперь необходимо добавить документы, на которых будет обучаться NLP-модель:

  1. Откройте созданный пакет двойным щелчком мыши.
  2. Выберите меню Файл > Загрузить изображения....
  3. В открывшемся окне нажмите кнопку Параметры обработки изображений... и выберите опцию Создавать документ для каждого файла, нажмите ОК.
  4. Выберите документы, на которых будет обучаться NLP-модель.
  5. После загрузки всех файлов выделите их, выберите Распознавание > Наложить определение документа или нажмите на них правой кнопкой мыши > Наложить определение документа. Выберите нужное определение документа.

Качество NLP-модели, созданной в результате обучения, зависит от количества документов в пакете для обучения и от качества их разметки.  

  • Все поля, описанные в определении документа, должны быть размечены на документах для обучения.
  • Рекомендуемое количество документов в каждом пакете для обучения – от 100 до 500. Это позволит подобрать оптимальные параметры NLP-модели и в то же время не будет замедлять процесс обучения.

После успешной загрузки документов необходимо вручную разметить поля на документах - указать NLP-моделям на искомые сущности. Для каждого документа повторите следующие действия:

  1. Откройте документ двойным щелчком.
  2. Выделите поле, для которого будет извлекаться информация из документа, и выберите его значение на документе или выделите его прямоугольником. Повторите этот шаг для каждого поля.
  3. Перейдите к следующему документу, нажав кнопку , и разметьте поля для всех документов.
  4. Сохраните изменения.

После разметки всех документов вернитесь в вид Пакеты обучения извлечения полей. Выберите Обучить из контекстного меню пакета. После обучения модель готова к использованию.

Результаты обучения могут быть отключены или удалены. Для этого выберите опцию Отключено или Удалить из контекстного меню нужного Пакета обучения извлечения полей.

Обученная NLP-модель может быть перенесена в другой проект. Для этого необходимо импортировать пакет обучения вместе с определением документа, к которому он привязан.

1/14/2021 2:17:24 PM


Please leave your feedback about this article