XML 結果
XML結果ファイルには、パラメータとジョブ実行の結果に関する情報が含まれています。 成功と失敗の両方のジョブのXML結果ファイルが作成されます。
ワークフローのプロパティダイアログボックスの 6. 出力 タブでは、 XML結果 が公開されるフォルダを指定できます。
重要事項!XML 結果ファイルの名前は、64 文字を超えてはなりません。
ジョブを実行する時にエラーがあると、ジョブは失敗とマークされ、XML 結果ファイルと未処理の画像ファイルがワークフローのプロパティダイアログボックスの4. 品質管理タブの失敗したジョブを保存で指定されているように保存されます。
メインXML結果タグ
タグ | 説明 |
<XMLResult> |
これはルートタグです。 その属性は以下の情報を含んでいます。
|
<InputFile> |
このタグの属性から入力ファイルに関する一般的な情報が提供されます。
<InputFile>に埋め込まれたタグは以下の情報が含まれます:
注:出力ファイルがOCRの実行より、入力ファイルのコピーにより取得されている場合、対応の<InputFile>タグ内の<OutputDocuments>タグによって示されます。 注:入力画像ファイルを処理して間にエラーが発生した場合、<Error>タグは<InputFile>タグ内に配置されます。 <Error>タグにはエラーの説明が含まれています。 |
<JobDocument> |
このタグは処理された入力ファイルを一緒にグループ化することによって取得されたドキュメントに関する情報を提供します。 ドキュメントアセンブリの設定によって、このドキュメントは多分一つだけの入力ファイル、複数の入力ファイル、又は入力ファイルから取り出された特定のページで構成されます。 <OutputDocuments>タグの数は与えられたジョブ内に処理された出力ファイルの数と同じです。 <OutputDocuments>に埋め込まれたタグは出力ファイルに関する以下の情報が含まれています。
次のタグは、電子メールメッセージを処理するときに使用されます。 文書に電子メールメッセージの本文または添付ファイルが含まれているかどうか、そしてメインメッセージまたは添付メッセージから取得されたものかどうかを示します。 タグは電子メールファイルに使用されます。電子メールファイルは、電子メールで受け取るか、入力フォルダから取得します。
注:電子メールメッセージとその添付ファイルのすべてのテキストを含むジョブ用に1つの文書が作成された場合、IsMailBodyFile = true、IsMailAttachedMessageFile = false と表示されます。 注:ドキュメントにメインメッセージに添付されているファイルのテキストのみが含まれている場合は、IsMailBodyFile = false、IsMailAttachedMessageFile = false となります。 注:IsMailBodyFile および IsMailAttachedMessageFile のプロパティは、値が false でない場合、XML 結果ファイルに含まれます。 |
<ImageProcessingParams> |
このタグの属性には、追加画像処理設定に関する情報が含まれ、例えば:
|
<RecognitionParams> |
属性と<RecognitionParams>の埋め込みタグにはOCRの設定が含まれ、例えば:
|
<ExportParams> |
<ExportParam >に埋め込まれたタグには、エクスポートのパラメータが含まれています:
|
<Statistics> | このタグの属性には処理されたファイルの一般的な統計が含まれ、全ての実行されたジョブの統計が組み合わせられます。 |
XML結果変更ログ
- Id属性は<InputFile>に追加され、入力ファイルの識別子が含まれています。
- 埋め込み<Page>タグは<InputFile>に追加され、またIdは入力ドキュメントのページの識別子であり、ページ番号は入力ファイル内の数です。
- 埋め込み<Pages>タグは<JobDocument>に追加されます。<Pages>に<FileId>と<ページID>タグが順次に埋め込まれています。<FileId>は入力ファイルの識別子であり、また<PageId>は処理されたページが得られた入力ドキュメントのどのページを示すページの識別子です。
上記の変更は既に導入されたので、ユーザーは入力ファイルのページがそれぞれどの出力ファイルのページに対応するかをはっきり確認できます。
- RewriteIfFileExists 属性は既に<FormatSettings>に追加されました。 この属性が真の場合、出力フォルダに発見された任意の出力ファイルが既に上書きされたことを意味します。
- SkipRecognizePdfsWithTextLayerの属性は既に<ExportFormat>に追加されました。 この値を true に設定し、「出力フォーマットの設定」 ダイアログボックスの 「PDF」タブで 「高品質のテキストレイヤーでファイルを変更しないでください」オプションを有効にします 。
- SkipRecognizePdfsWithTextLayerCoefficient 属性は既に<ExportFormat>に追加されました。 この属性は、プログラムが入力 PDF ファイル内のテキストレイヤーの品質をどのようにチェックしたかを確定する設定をリストします。
- ProhibitHiddenTextDetection 属性は既に<RecognitionParams>に追加されました。 この属性はデフォルトで trueに設定され、これで 入力PDFファイル内の画像上のテキストは認識されません。 falseに設定されると、プログラムは画像領域内のテキストを認識し、出力ドキュメント内にそれらの領域のテキストレイヤーを作成します。
- TiffMaxBrokenLastLinesCount 属性は既に<ImageProcessingParams>要素に追加されました。 この属性は、破損した TIFF ファイルの処理が有効か無効かを示します。
- EnablePeriodicCrawling 属性は既に<InputSettings>に追加されました。この属性を trueに設定すると、各新規ファイルのために クロールライブラリ」を有効にするのと同じな効果を持っています。ワークフローのプロパティダイアログボックスの1. 入力 タブでのN時間単位。 デフォルトの設定は偽です。
- CrawlingInterval 属性は既に<InputSettings>に追加されました。 この属性の値は、プログラムが ドキュメントライブラリのワークフローで新しいファイルをチェックする頻度を示します。
- <BackgroundColorDetectionParams> 属性付きの <BackgroundColorDetectionType>パラメータは既に<ImageProcessingParams>に追加されました。この属性は、画像が傾き補正された後に現れる空白領域を埋めるために使用された色を示します。 この属性は デフォルト で自動に設定されます。
- IndexingStationPagesSlice 属性は <IndexingSettings> に追加 されました。 複数ページのドキュメントのページは nページのセットで索引作成ステーションに到着し。 この属性の値は、1セットあたりのページ数を示します。 デフォルト値は5です。
こちらも参照してください:
26.03.2024 13:49:51