XML 結果

XML結果ファイルには、パラメータとジョブ実行の結果に関する情報が含まれています。 成功と失敗の両方のジョブのXML結果ファイルが作成されます。

ワークフローのプロパティダイアログボックスの 6. 出力 タブでは、 XML結果 が公開されるフォルダを指定できます。

重要事項!XML 結果ファイルの名前は、64 文字を超えてはなりません。

ジョブを実行する時にエラーがあると、ジョブは失敗とマークされ、XML 結果ファイルと未処理の画像ファイルがワークフローのプロパティダイアログボックスの4. 品質管理タブの失敗したジョブを保存で指定されているように保存されます。

メインXML結果タグ

タグ 説明
<XMLResult>

これはルートタグです。 その属性は以下の情報を含んでいます。

  • ID - ジョブの識別子
  • IsFailed - ジョブが失敗したかどうかを示します
  • Priority -ジョブの優先度を示す
  • Date - ジョブの処理が受け入れられた日付と時刻
<InputFile>

このタグの属性から入力ファイルに関する一般的な情報が提供されます。

  • Name - ファイルの名前
  • Id - ファイルの識別子
  • FileModificationTime - ファイルが作成された日付と時刻

<InputFile>に埋め込まれたタグは以下の情報が含まれます:

  • <Statistics> - ファイル統計(文字の総数、信頼できない認識文字の数、ページ数)
  • <Page> -このタグの属性により入力と出力ファイルとの対応を確立します(Idはページの識別子であり、PageNumberはファイル内のページの数である)

注:出力ファイルがOCRの実行より、入力ファイルのコピーにより取得されている場合、対応の<InputFile>タグ内の<OutputDocuments>タグによって示されます。

注:入力画像ファイルを処理して間にエラーが発生した場合、<Error>タグは<InputFile>タグ内に配置されます。 <Error>タグにはエラーの説明が含まれています。

<JobDocument>

このタグは処理された入力ファイルを一緒にグループ化することによって取得されたドキュメントに関する情報を提供します。 ドキュメントアセンブリの設定によって、このドキュメントは多分一つだけの入力ファイル、複数の入力ファイル、又は入力ファイルから取り出された特定のページで構成されます。

<OutputDocuments>タグの数は与えられたジョブ内に処理された出力ファイルの数と同じです。

<OutputDocuments>に埋め込まれたタグは出力ファイルに関する以下の情報が含まれています。

  • <FileName> - ファイルの名前
  • <FormatSettings> - このタグの属性はエクスポートの設定が含まれます
  • <OutputLocation> - 出力フォルダの経路
  • <NamingRule> - ファイルの命名規則
  • <Pages> - 出力ファイルの現在のページに関する情報 (出力ファイルの各ページに対応するタグ。<Pages>に埋め込まれたタグは現在のページが取得されたページとファイルを示します。)
  • <Statistics> - ジョブ統計

次のタグは、電子メールメッセージを処理するときに使用されます。 文書に電子メールメッセージの本文または添付ファイルが含まれているかどうか、そしてメインメッセージまたは添付メッセージから取得されたものかどうかを示します。 タグは電子メールファイルに使用されます。電子メールファイルは、電子メールで受け取るか、入力フォルダから取得します。

  • <IsMailBodyFile> - ドキュメントにメインの電子メールメッセージの本文が含まれているかどうかを示します
  • <IsMailAttachedMessageFile> - 添付された電子メールメッセージの本文または添付ファイルがドキュメントに含まれていることを示します。

注:電子メールメッセージとその添付ファイルのすべてのテキストを含むジョブ用に1つの文書が作成された場合、IsMailBodyFile = true、IsMailAttachedMessageFile = false と表示されます。

注:ドキュメントにメインメッセージに添付されているファイルのテキストのみが含まれている場合は、IsMailBodyFile = false、IsMailAttachedMessageFile = false となります。

注:IsMailBodyFile および IsMailAttachedMessageFile のプロパティは、値が false でない場合、XML 結果ファイルに含まれます。

<ImageProcessingParams>

このタグの属性には、追加画像処理設定に関する情報が含まれ、例えば:

  • SplitDualPages - 見開きページの分割
  • ConvertToBWFormat - カラー画像とグレースケール画像をモノクロに変換
  • RotationType - 画像の回転
  • Deskew - 画像傾き補正
  • RemoveTexture - 背景ノイズなどの除去
<RecognitionParams>

属性と<RecognitionParams>の埋め込みタグにはOCRの設定が含まれ、例えば:

  • <Language> - OCR言語
  • RecognitionQuality - 最適化方法(速度よりもむしろ品質の方を選ぶ、逆の場合も同じ)
  • RecognitionMode - 認識モード(全てのテキストを認識し又はバーコードだけを認識)
<ExportParams>

<ExportParam >に埋め込まれたタグには、エクスポートのパラメータが含まれています:

  • <ExportFormat> - 処理された画像の出力フォーマットとそのパラメータ
  • <OutputLocation> - 出力先
  • <XMLResultLocation> - XML結果ファイルが公開されたフォルダ
  • <NamingRule> - ファイルの命名規則
<Statistics> このタグの属性には処理されたファイルの一般的な統計が含まれ、全ての実行されたジョブの統計が組み合わせられます。

XML結果変更ログ

  • Id属性は<InputFile>に追加され、入力ファイルの識別子が含まれています。
  • 埋め込み<Page>タグは<InputFile>に追加され、またIdは入力ドキュメントのページの識別子であり、ページ番号は入力ファイル内の数です。
  • 埋め込み<Pages>タグは<JobDocument>に追加されます。<Pages>に<FileId>と<ページID>タグが順次に埋め込まれています。<FileId>は入力ファイルの識別子であり、また<PageId>は処理されたページが得られた入力ドキュメントのどのページを示すページの識別子です。

上記の変更は既に導入されたので、ユーザーは入力ファイルのページがそれぞれどの出力ファイルのページに対応するかをはっきり確認できます。

  • RewriteIfFileExists 属性は既に<FormatSettings>に追加されました。 この属性が真の場合、出力フォルダに発見された任意の出力ファイルが既に上書きされたことを意味します。
  • SkipRecognizePdfsWithTextLayerの属性は既に<ExportFormat>に追加されました。 この値を true に設定し、「出力フォーマットの設定」 ダイアログボックスの PDF」タブで 「高品質のテキストレイヤーでファイルを変更しないでください」オプションを有効にします
  • SkipRecognizePdfsWithTextLayerCoefficient 属性は既に<ExportFormat>に追加されました。 この属性は、プログラムが入力 PDF ファイル内のテキストレイヤーの品質をどのようにチェックしたかを確定する設定をリストします。
  • ProhibitHiddenTextDetection 属性は既に<RecognitionParams>に追加されました。 この属性はデフォルトで trueに設定され、これで 入力PDFファイル内の画像上のテキストは認識されません。 falseに設定されると、プログラムは画像領域内のテキストを認識し、出力ドキュメント内にそれらの領域のテキストレイヤーを作成します。
  • TiffMaxBrokenLastLinesCount 属性は既に<ImageProcessingParams>要素に追加されました。 この属性は、破損した TIFF ファイルの処理が有効か無効かを示します。
  • EnablePeriodicCrawling 属性は既に<InputSettings>に追加されました。この属性を trueに設定すると、各新規ファイルのために クロールライブラリ」を有効にするのと同じな効果を持っていますワークフローのプロパティダイアログボックスの1. 入力 タブでのN時間単位。 デフォルトの設定はです。
  • CrawlingInterval 属性は既に<InputSettings>に追加されました。 この属性の値は、プログラムが ドキュメントライブラリのワークフローで新しいファイルをチェックする頻度を示します。
  • <BackgroundColorDetectionParams> 属性付きの <BackgroundColorDetectionType>パラメータは既に<ImageProcessingParams>に追加されました。この属性は、画像が傾き補正された後に現れる空白領域を埋めるために使用された色を示します。  この属性は デフォルト で自動に設定されます。
  • IndexingStationPagesSlice 属性は <IndexingSettings> に追加 されました。 複数ページのドキュメントのページは nページのセットで索引作成ステーションに到着し。 この属性の値は、1セットあたりのページ数を示します。 デフォルト値は5です。
こちらも参照してください:

ABBYY FineReader Server

XMLチケットのアーキテクチャ

29.11.2022 17:26:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.