Список ключевых слов
Ключевые слова для группы полей Vendor / Business Unit, Invoice Header Data
Ключевые слова применяются для поиска в их окрестности значений извлекаемых полей. Как правило, это название поля или другая подпись поля на изображении.
Например, Invoice Date:. В данном случае "Invoice Date" является ключевым словом для поля InvoiceDate.
Ключевые слова можно задать, используя Найденные элементы. Каждый Найденный элемент связан только с одним полем определения документа, но поле может иметь несколько Найденных элементов, каждый из которых будет отвечать за отдельную модель отношений ключевого слова и значения поля на инвойсе.
- Ключевые слова задаются на язык и на страну. При наложении определения документа список используемых ключевых слов берётся из объединения стран поставщика и подразделения компании, а также языков этих стран.
- К ключевым словам применяется нормализация:
- игнорируются пробелы, табуляция, переносы строк, диакритика
- заглавные буквы приравниваются к строчным.
Например, Tax point = taxpoint. - Допускаются 2 — 3 (в зависимости от элемента) ошибки распознавания в ключевом слове.
- В случае двуязычных ключевых слов, например, Quantity/Anzahl рекомендуется добавлять в качестве ключевого слова всю строку Quantity/Anzahl в оба языка.
Группа полей | Найденные элементы | Описание | В каких настройках задается |
Vendor / Business Unit | Банковский счет | Ключевые слова для поля Банковский счет | Страна (вкладка Ключевые слова) |
Банковский код | Ключевые слова для поля Банковский код | Страна (вкладка Ключевые слова) | |
IBAN | Ключевые слова для поля IBAN | Страна (вкладка Ключевые слова) | |
Национальный VATID | Ключевые слова для поля Национальный VATID | Страна (вкладка Ключевые слова) | |
Итого | Ключевые слова для поля Итого | Страна (вкладка Ключевые слова) | |
Итого налог | Ключевые слова для поля Итого налог | Страна (вкладка Ключевые слова) | |
VATID | Ключевые слова для поля VATID | Страна (вкладка Ключевые слова) | |
Invoice Header Data | PurchaserNameLabels | Варианты названий поля PurchaserName на данном языке | Язык |
PurchaserNameFalseFieldPrefixes | Варианты названий полей, ошибочно распознаваемых как поле Purchaser Name. Рекомендуется заполнять при обнаружении конкретных примеров | Язык | |
CreditNoteKeywords | Слова для обозначения типа документа Credit Note на данном языке | Язык | |
InvoiceIdentifiers | Слова, обозначающие, что документ является инвойсом | Язык | |
OrderNumberLabels | Варианты названий поля OrderNumber на данном языке | Язык | |
InvoiceNumberExcludePreffixes | Слова, которые нужно исключать из начала номера. Например, “Nr.” | Язык | |
InvoiceNumberExcludeSuffixes | Слова, которые нужно исключать из окончания номера. Рекомендуется заполнять при обнаружении конкретных примеров | Язык | |
InvoiceNumberWithDateLabels |
Текст перед номером инвойса в случае, если номер и дата выводятся в одной строке и их разделяет косая черта или другой символ. Пример: Invoice Number / date 23061336 / 07.07.2013 Rechnungsnr./ -datum 23061336 / 07.07.2013 |
Язык | |
InvoiceNumberHighConfidenceLabels InvoiceNumberLowConfidenceLabels |
В список InvoiceNumberHighConfidenceLabels входят слова, однозначно определяющие поле, например, “Invoice number», «Document number». Список InvoiceNumberLowConfidenceLabels предназначен для менее вероятных слов: "No.", "Bill" | Язык | |
DueDateLabels | Варианты названий поля DueDate на данном языке | Язык | |
DeliveryDateLabels | Варианты названий поля DeliveryDate на данном языке | Язык | |
InvoiceDateLabelsNearCity | Текст между названием города и датой, если они находятся в одной строке. Например, запятая | Язык | |
InvoiceDateLabelsNearInvoiceNumber | Текст между номером инвойса и датой, если они находятся в одной строке | Язык | |
InvoiceDateHighConfidenceLabels InvoiceDateLowConfidenceLabels |
В список InvoiceDateHighConfidenceLabels входят слова, однозначно определяющие поле, например, “Invoice date», «Document date». Список InvoiceDateLowConfidenceLabels предназначен для менее вероятных слов: "Tax Date", "Tax Point" | Язык |
Ключевые слова для группы полей Amounts
Программа ABBYY FlexiCapture умеет различать ситуации, когда одно ключевое слово является подстрокой другого. Например, если добавлены ключевые слова total и total netto, а на изображении находится total netto, то это будет определено как ключевое слово total netto, а не как total.
- Ключевые слова допускают 3 ошибки распознавания.
- Такое ограничение приводит к ошибкам. Например, могут быть перепутаны слова brutto и netto. Для избежания ошибок, если добавлено некоторое значение в список AmountTotalNettoLabels, например total netto, стоит добавить соответствующее значение в список AmountTotalLabels, например, total brutto.
Группа полей | Найденные элементы | Описание | В каких настройках задается |
Amounts |
AmountTotalHighConfidenceLabels AmountTotalLowConfidenceLabels |
Подписи поля Total. Подписи, которые встречаются только у итоговой суммы инвойса, стоит помещать в группу HighConfidence. Подписи, которые могут быть встречены и у других сумм инвойса, — в LowConfindence. |
Язык |
AmountTotalNettoLabels | Ключевое слово левее или выше поля Total Netto | Язык | |
AmountTotalTaxLabels | Ключевое слово левее или выше поля Total Tax | Язык, Страна (вкладка Ключевые слова) | |
ReversedChargeKeywords | Слова для обозначения Reversed Charge на данном языке | Язык | |
Ставки налогов | Ключевые слова для налоговых ставок | Страна (вкладка Ставки налогов) | |
Валюта | Ключевые слова (символы) для обозначения валюты | Страна (вкладка Валюта) |
Замечание. Не следует добавлять одинаковые слова в список Total Netto и Total.
Ключевые слова для группы полей Line Items
Ключевые слова используются для нахождения заголовка таблицы с позициями инвойса, а также для нахождения конкретного столбца таблицы. В качестве ключевых стоит добавлять слова, которые часто используются в заголовке соответствующих Найденному элементу столбцов.
Если одно и тоже слово часто встречается в заголовках разных столбцов, рекомендуется добавить его в Найденные элементы соответствующих столбцов — в этом случае программа будет пытаться отличить столбцы по содержимому строк в столбцах.
В случае, если автоматическое различение столбцов после этого работает неверно (не получается отличить столбцы) или в случае, если слово бывает часто в одном столбце, и редко в остальных, необходимо оставить слово только в Найденном элементе столбца, в заголовке которого оно встречается наиболее часто.
- Ключевые слова допускают 3 ошибки распознавания.
- Ключевые слова должны быть в одну строку.
- Содержимое столбца должно находиться по вертикали под заголовком столбца.
- Ключевое слово на изображении должно быть окружено пробелами, запятыми или точками. Т.е. Quantity/Anzahl — это одно слово, а Quantity / Anzahl — два слова.
Если встречаются различные написания, то необходимо добавить в качестве ключевых три слова: Quantity/Anzahl, Quantity, Anzahl.
Группа полей | Найденные элементы | Описание | В каких настройках задается |
Line Items | LineItemsArticleNumberLabels | Ключевое слово для столбца ArticleNumber | Язык |
LineItemsArticleNumberBULabels | Ключевое слово для столбца Article Number BU | Язык | |
LineItemsCurrencyLabels | Ключевое слово для столбца Currency | Язык | |
LineItemsDeliveryDateLabels | Ключевое слово для столбца DeliveryDate | Язык | |
LineItemsDescriptionLabels | Ключевое слово для столбца Description | Язык | |
LineItemsDiscountAmountLabels | Ключевое слово для столбца Discoun Amount | Язык | |
LineItemsDiscountPercentageLabels | Ключевое слово для столбца Discount Percentage | Язык | |
LineItemsMaterialNumberBULabels | Ключевое слово для столбца Material Number BU | Язык | |
LineItemsMaterialNumberLabels | Ключевое слово для столбца Material Number | Язык | |
LineItemsOrderDateLabels | Ключевое слово для столбца Order Date | Язык | |
LineItemsOrderNumberLabels | Ключевое слово для столбца Order Number | Язык | |
LineItemsPositionLabels | Ключевое слово для столбца Position | Язык | |
LineItemsQuantityLabels | Ключевое слово для столбца Quantity | Язык | |
LineItemsQuantityOrderedLabels | Ключевое слово для столбца Quantity Ordered | Язык | |
LineItemsQuantityUndeliveredLabels | Ключевое слово для столбца Quantity Undelivered | Язык | |
LineItemsSubtotalVariants | Зарезервировано, не используется. | Язык | |
LineItemsTotalPriceBruttoLabels | Ключевое слово для столбца Total Price Brutto | Язык | |
LineItemsTotalPriceNettoLabels | Ключевое слово для столбца Total Price Netto | Язык | |
LineItemsUnitsOfMeasureLabels | Ключевое слово для столбца Units of Measure | Язык | |
LineItemsUnitsOfMeasureVariants | Возможные значения полей в столбце Unit Of Measure | Язык | |
LineItemsUnitPriceDenominatorLabels |
Подписи в заголовке столбца, который используется как множитель для столбца Unit Price при вычислении равенства для позиции инвойса: Unit Price * Denominator * Quantity = Total Netto. Например, если UnittPrice указано за одно изделие, а Quantity указывает число упаковок, то логическому столбцу UnitPriceDenoinator будет соответствовать столбец с количеством изделий в упаковке. |
Язык | |
LineItemsUnitPriceLabels | Ключевое слово для столбца UnitPrice | Язык | |
LineItemsVATAmountLabels | Ключевое слово для столбца VAT Amount | Язык | |
LineItemsVATCodeLabels | Ключевое слово для столбца VAT Code | Язык | |
LineItemsVATPercentageLabels | Ключевое слово для столбца VAT Percentage | Язык |
Замечание. Качество нахождения ключевых слов на изображении зависит от качества полнотекстового распознавания документа.
Замечание. Режим предраспознавания может быть изменён в настройках определения документа на вкладке Гибкое описание диалога свойств. Повышение качества распознавания может негативно сказаться на скорости распознавания инвойса.
1/14/2021 2:17:24 PM