用語集
A
ABBYY FlexiCapture
定型(固定)フォーム、半定型(フレキシブルフォームおよび文書)、定型なし(自由形式)というさまざまな文書タイプからデータをシングルフローで入力するためのソフトウェアソリューション。
ABBYY FlexiLayout Studio
使用される文書構造の FlexiLayout を作成できるプログラムで、文書の自動認識に使用できます。
ABBYY FormDesigner
ABBYY FormDesigner は、機械による読み取りが可能なフォームのレイアウト設計に使用されます。複製および入力されたフォームは、ABBYY FlexiCapture 自動フォーム入力システムで処理できます。設計されるレイアウトの品質(機械による読み取り具合)によって後続の全処理ステージ(スキャン、認識、検証、エクスポート)の効果が決定するため、フォームのレイアウト設計は重要なステージです。
ABBYY FlexiCapture for Invoices
まず、ABBYY FlexiCaptureは、使いやすくインテリジェントなインボイス処理用ソフトウェアソリューションです。
ADF
自動文書フィーダー。どんな枚数の文書でも手動の追加処理なしでスキャンできる、自動文書フィード用デバイス。
管理者
文書入力のプログラム設定(文書定義の作成と編集、プロファイルのインポート)を許可された ABBYY FlexiCapture のユーザー。
アルファベット
記述されている言語で使用される文字のセット。
アンカー
黒い正方形、長方形、十字、角括弧の形状の静的要素で、文書定義のマッチングに使用されます。
詳細...
アンカーバーコード
データ抽出を目的としていないバーコードを表す静的要素。アンカーバーコードは、文書定義のマッチングや識別に使用できます。
アンカーテキスト
空白のフォームにあるテキストを表す静的要素で、データ抽出は目的とされていません。説明テキストやヘッダーである可能性があります。アンカーテキストは文書定義のマッチングや識別に使用できます。
角度
角括弧形のアンカー。
付録
フィールドを含まないものの、文書アセンブリに含まれているページ。これらのページからは抽出されないものの、データは画像または PDF 検索可能ファイルとして保存されます。詳しくは、付録のある文書の文書定義の作成。
アセンブリエラー
このエラーが発生するのは、文書アセンブリで作成された文書に他の文書からのページが含まれる場合、ページの順番が間違っている場合、文書のページのキーフィールドの値がマッチしない場合です。
自動学習
ABBYY FlexiCaptureが自動的に新しいフィールドを検出して文書タイプを識別することを学ぶ能力。
B
バーコード
機械による読み取りが可能なフォーム要素で、白と黒のバーが一定の長さで交互に連続しており、これによってデジタル情報がエンコード化されます。文書内のバーコードは、情報の抽出(バーコードフィールド)や、文書定義のマッチングと識別(アンカーバーコード)。
バーコードフィールド
写真を含んでいる文書定義バーコードが含まれている文書定義フィールド。
バーコード認識
グラフィックバーコード画像の数字やテキストへの変換。
バッチタイプ
対応するバッチにある文書の処理方法を定義するバッチのプロパティ。詳しくは、バッチタイプ。
白黒の線形フォーム
情報フィールドの枠線が、スキャン中に消えない通常の線で形成されるフォーム。
黒四角
黒い正方形のアンカー。
明るさ
スキャナがどのポイントでグレースケールのハーフトーンを白として検出するかを決定する光感度のしきい値。
C
チェックマーク
マーク(チェックマーク、十字、点、塗りつぶしなど)が入力され、機械による読み取りが可能なフォーム要素。
チェックマークフィールド
写真を含んでいる文書定義チェックマーク。
チェックマークグループ
付近にある複数のチェックマークを結ぶ、機械による読み取りが可能なフォーム。チェックマークグループでは、1 つまたは複数のチェックマークを選択できます。
チェックマークグループフィールド
写真を含んでいる文書定義チェックマークグループ。
Classifier
文書定義適用前のページ予備識別、およびマッチする FlexiLayout や代替レイアウトの選択を目的として FlexiLayout Studio で作成されたプロジェクト。
コードページ
特定の言語の文字セットを記述する値のページ。
カラー背景フォーム
情報フィールドがすべて白い長方形で、スキャン中に消えるカラーの背景を持つフォーム。
コントラスト
画像の最も暗いエリアと最も明るいエリアの明るさの比率
コントロール
データフォームにある、テキスト、フィールド、ボタン要素。詳しくは以下を参照してください:コントロールキーを挿入。
修正済みチェックマーク
誤って選択され、塗りつぶされたチェックマーク。チェックマークフィールドのオプションが修正を許可有効になっていると、プログラムは塗りつぶされたチェックマークを選択されていないものとして認識します。
十字
十字形のアンカー。
カスタムデータタイプ
ユーザー定義のデータタイプ。詳しくは、カスタムデータタイプの作成。
D
データベースルックアップ
認識されたデータを、対応するデータベースレコードとマッチングさせること。
データセット
文書の自動チェックに使用されるデータ。データセットはABBYY FlexiCaptureの表に保存され、スケジュールに応じて同期されたり、外部ソースから取得される場合もあります。
データタイプ
フィールド値と思われる項目に関する既知の制約を記述するフィールド属性。認識バリアントと思われる項目数を削減するため、フィールドの認識中に使用されます。
詳細...
記述ファイル
画像がホットフォルダから追加されているときのバッチの作成方法を定義する補助ファイル。詳細は以下を参照してください:記述ファイル。
辞書
特定のデータタイプを決定する語句のリスト。
詳細...
文書
1 ページまたは複数ページの画像と、そこから抽出されたデータの組み合わせ。
文書のバッチ
ユーザーによってグループ化された文書の組み合わせ。バッチには通常、一度にスキャンまたは特定のフォルダからインポートされた大量の文書が含まれています。詳しくは、文書バッチ。
文書のクラス
いくつかの共通の特性を共有する一連の文書またはページ。
文書のデータ
文書ページ画像の処理(認識、検証、認識結果の編集)後にキャプチャされたデータ。
文書の定義
文書定義は、特定のタイプの文書の識別および処理の原則を定義し、以下を含みます:
- 文書構造、すなわち文書をどのように組み立てるべきかを定義する、このタイプの文書に対する許容可能なページ順序の記述
- 文書定義のセクション
- フィールドデータが満たすべきルールのリスト
- データウィンドウにおけるフィールドとそのシグナチャの場所(データフォームビュー)
- 文書のエクスポート設定
- 文書処理設定
文書定義識別子
識別子を使用して必要な文書定義を選択するプロセス。。
文書の定義の一致
文書定義を選択し、そのフィールドを画像とマッチングさせるプロセス。
文書の定義の発行
編集後に新しいバージョンの文書定義へのアクセスを許可すること。発行されたバージョンは作業バッチからの文書の処理に参加し、未発行のローカルバージョンはテストバッチ。詳しくは、文書定義の編集および発行。
文書の定義セクション
文書定義の一構成要素。論理的に完全なフィールドのセットを含む、1 つまたは複数のページに対応します。1 つのセクション内のフィールド(複数ページのテーブルなど)はページを通じて継続できますが、複数のセクションからのフィールドセットは横断できません。
セクションの定義はフレキシブルまたは固定にすることができます。
文書の識別子
一部の所定の文書タイプのうちの1つに文書を割り当てるプロセス。
説明しています
特定の目的に使用される論理的に関連する一連の文書。例えば、ビジネスプロセスは、記入された申請書といくつかの付随する書類からなる申請者によって提供された一連の書類によって開始することができます。申請書に申請者が提供する情報に応じて、付随する書類の一部はオプションであるが、その他のものは申請書に同封する必要がある。
文書のテキスト
FlexiLayout 適用前の予備認識中に文書からキャプチャされたすべてのテキスト。検証中に使用できるよう、このテキストを保存することもできます(ハードディスクに追加スペースが必要)。
文書タイプ
共通のいくつかの特性を持ち、ビジネスプロセスにおいて特定の役割を果たす多数の文書。
文書タイプの例としては、請求書、契約書、パスポートなどがあります。
文書のバリアント
複数の特性を共有する同じタイプに属する多数の文書。
文書のバリアントの例には、異なる仕入先からの請求書と同じ銀行からのクレジット明細が含まれます。
ドットマトリックスプリンタ
ドットマトリクスプリンタで印刷されたテキストを表す、認識可能なテキストのタイプ。
dpi
1 インチあたりのドット数。1 インチあたりのドット数で、画像解像度の測定単位です。
E
環境変数
システム設定など、テキスト保存のために使用される文字列。環境変数は、エクスポートされたファイルの名前を指定する時に使われるデータベース接続の文字列や変数の保存で使用されます。
エラー/警告
エラー/警告は、1つまたは複数のフィールドから抽出されたデータが、自動チェック時に適用されるルールまたは指定されたフォーマットと一致しないルールを満たしていない場合に発生します。エラーと警告には2つの異なるタイプがあります:
- 単一フィールドエラー/警告は、1つのフィールドに影響を与えるルールとフォーマットによって生成されます。
- マルチフィールドエラー/警告は、複数のフィールドに影響を与えるルールによって生成されます。
説明文
機械による読み取りが可能で、記述テキスト(フォーム名、フィールド名、フィールドの説明など)を表すフォーム要素。
エクスポート
処理されたデータを外部の情報システムやファイルに転送するプロセス。
エクスポートプロファイル
出力ファイルのフォーマット、出力パス、エクスポート条件など、処理されたデータでの操作を定義する設定セット。
外部データベース
参照データを保存するテキストファイル、または ODBC 互換データベース。参照データには、キャプチャされたフィールドの値や、キャプチャされたフィールドに必要な情報が含まれることがあります。
F
フィールド
データ抽出のための文書要素。フィールドは、シンプルな(内部構造がない)場合や、各セルが個々の下位フィールドとして表示されるテーブルフィールドなど複合的な場合があります。詳しくは、文書定義フィールドの作成。
フィールド部分
文書定義で強調表示され、データ抽出を目的とする画像領域。
フィールド検証
検証モードの 1 つで、認識された文字はフィールドのコンテキストでの検証用に送信されます。
詳細...
複数のインスタンスのあるフィールド
同種の複数のオブジェクトを記述するために使用されるフィールド(反復オブジェクト)。つまり、これら複数のオブジェクトは 1 つの同一フィールドであり、同じのプロパティを共有しています。複数のインスタンスを持つフィールドは、同一フィールドを複数作成する手間を省くために使用されます。複数のインスタンスを持つフィールドは、別個のファイルやデータベーステーブルにエクスポートされます。詳しくは、複数のインスタンスを持つフィールド。
複数の部分のあるフィールド
複数の領域からなる、画像上のフィールド。そのような領域は、離れて存在していたり別のページにあることもあります。同じフィールドに属するすべての領域からの値は、組み合わされ 1 つのフィールドとして一緒にエクスポートされます。通常、複数のページにまたがるオブジェクト(大型のテーブルなど)のために使用されます。詳しくは、複数の領域を持つフィールド。
部分のないフィールド
文書定義で検出されたものの、画像に領域がないフィールド。詳しくは、領域のないフィールド。
固定フォーム
フォーマット、数字、レイアウトが厳格に定義され、文書インスタンス間に差がない固定情報フィールドを持つ文書。
固定文書定義
固定フォーム処理用に設計された文書やまたはそのセクションの定義。。固定文書定義のフィールドには固定の場所があります。
FlexiLayout
半定型の文書構造のの説明。この記述はABBYY FlexiLayout Studioで設計され、以下にエクスポートされます:ABBYY FlexiCapture。ファイルフォーマット*.aflFlexiLayout は、フレキシブルフォームにあるフィールドを検出し特定する指示の一種です。
FlexiLayout バリアント
文書バリアント用の FlexiLayout のうち、その文書用に作成されたか、その文書バリアントでトレーニングされたものです。ジェネリック FlexiLayout と組み合わせて使用されます。
フレキシブル文書定義
半構造化された文書の処理用に設計された、文書またはそのセクションの定義。以下を接続して作成します:FlexiLayout。そのような文書定義のフィールドには固定の場所がありません。これらのフィールドは、FlexiLayout を利用して検出されます。詳しくは、半構造化された文書処理のための文書定義の作成。
フォーム
1 ページまたは複数ページからなり、人の手もしくは何らかの印刷技術で入力が行われるよう設計されている文書。
枠付けされたテキスト
テキストマーキングの種類で、テキストがフレームで区切られるもの。
表示...
コーム上の枠付けされたテキスト
テキストマーキングの種類で、テキストがフレームで区切られ、下部境界線が櫛状のもの。
表示...
G
グレー背景フォーム
情報フィールドがすべて白い長方形で、スキャン中に消えるグレー背景を持つフォーム。
グループ検証
検証モードの 1 つで、同一として認識された文字はグループでの検証用に送信されます。
詳細...
H
手書きのテキスト
明瞭な手書きのテキストを示す、認識可能なテキストの種類
手書きテキスト
認識可能なテキストの種類で、文字が結合しているもの、または部分的に結合しているもの。
注:現在、英語の手書き文字のみ認識可能です。
ホットフォルダ
ローカルまたはリモートコンピュータのハードドライブにあるフォルダで、画像のインポートに使用されます。通常、ユーザーの関与なしで定期的に反復される画像アップロードに使用されます。詳しくは、画像インポートプロファイル。
I
識別子
アンカーの場所が同じである複数の文書定義のうち、ある文書定義の特定部分に使用されるアンカー。オプションを文書定義の識別に使用このような静的要素のプロパティで有効にする必要があります。
アイデンティティプロバイダー
Azure AD、OneLogin、またはOktaなどのサードパーティーのシステムで、ID情報を管理し、クライアントに認証サービスを提供して、エンドユーザーが認証情報を1回入力するだけで、ローカルエリアネットワークの権限内のリソースすべてにアクセスできるようにします。
無視された文字
語の中にある文字(中点など)やソフトハイフン文字(作表制御記号など)のことで、存在してもある語を認識可能なデータタイプに結び付けようとするプログラムの動作を阻害しないもの。
詳細...
画像
ハードコピー文書からスキャンされたページの電子画像。
画像のスペックル除去
画像からのノイズ除去。データ認識結果の向上のため、スキャン中に発生したノイズは削除するようお勧めします。斑点除去中、プログラムは背景のドットやラスター形式の境界線も削除します。
画像のインポート
処理する画像をバッチに追加するプロセス。インポートは、ファイル、スキャナ、インポートプロファイルインポートプロファイル。詳しくは、ページ画像の追加。
画像の回転
真ん中を中心に画像を回転させること。
インポートプロファイル
バッチに画像を追加するための設定の組み合わせ:インポート元、画像処理オプション、ホットフォルダクリーンアップオプションなど。詳しくは、画像インポートプロファイル。
不正確に認識された文字
非常に不明確に認識された文字に対し、認識プロセスで自動的に割り当てられるステータス。
索引フィールド
並べ替えや検索用に文書をインデックス化する時に使用されるフィールド。詳しくは、インデックスフィールド。
反転画像
暗い背景に明るい色のテキストの画像。
インボイス
提供される商品、その数量、価格、特性(色や重量など)、出荷条件、関係者の詳細などをリスト表示する文書です。インボイスは、別個のソリューションであるABBYY FlexiCapture for Invoices。詳しくは、ABBYY FlexiCapture for Invoices。
ICR、インテリジェント文字認識
手書きの文字や数字が満載の文書を大量処理(手書き文字の認識)するために設計された技術やシステムのこと。
K
主要フィールド
ページ集合から文書への自動チェックを可能にするフィールド。主要フィールドの値は、同じ文書のどのページでも同一でなければなりません。
L
言語(現地語)
記述言語や関連する地域的パラメータのセット(日付や住所の書き方)を決定するフィールドプロパティ。
レイアウト
文書画像上のフィールドの位置。レイアウトは自動的に生成することも、手動で作成することもできます。以下も参照:参照レイアウトの形式で含まれています。
枠内の文字
テキストマーキングの種類で、どの文字もフレームで区切られます。フレームは相互に孤立していません。
表示...
独立した枠内の文字
テキストマーキングの種類で、どの文字もフレームで区切られます。フレームは相互に孤立しています。
表示...
コーム上の文字
テキストマーキングの種類で、「櫛」がテキストを区切ります。
表示...
M
機械印刷されたテキスト
活版印刷機器、または 300dpi の最小解像度を持つレーザープリンタやインクジェットプリンタで印刷された認識可能なテキストの種類。
機械で読み取り可能なフォーム
自動入力のたに特別設計されたフォーム。正常な処理に必要とされる作業要素(アンカー、バーコード、線など)が含まれています。
手動入力フィールド
認識不可能なためキーボードからの入力を必要とするテキスト(融合文字からなるテキストなど)が含まれている文書定義フィールド。
MRC(混合ラスターコンテンツ)
テキストとラスターの両方のフラグメントを含む画像に使用される圧縮方法。画像はフラグメントに分析され、最適な圧縮アルゴリズムがそれぞれ選択されます。このアプローチは、画像の画質を維持しながら、より良い圧縮率を提供します。
固定幅テキスト
テキストマーキングの種類で、文字はそれぞれ同じ高さとフレーム内に見つかるものの、フレームの境界線はスキャン中に消えます。
複数ページ文書
複数のページからなる文書。
マルチテナンシー
複数の独立したユーザーがABBYY FlexiCaptureを使用できるようにする機能。各テナントのデータは他のテナントと完全に分離されており、システムは各テナントにそのリソースの一部を割り当てます。
O
OCR(光学文字認識)
印刷されたテキストの光学認識。
OMR(光学マーク認識)
この技術によって、ABBYY FlexiCapture がフォームにある通常のマーク(チェックマークや十字など)を非常に明確に認識するだけでなく、誤って付けられた後に塗りつぶされたマークを正しく識別することもできます。
オペレータ
ABBYY FlexiCapture のユーザーで、文書の入力(画像の追加、認識の実行、検証、認識データのエクスポートなど)を遂行する人物。
オペレータの役割
ABBYY FlexiCapture のユーザーアカウントのプロパティ。これによって、ユーザーがアクセスできるデータやそのデータに実行できるアクションが決定します。詳しくは、設定されたプロジェクトの操作。
オーバーレイ
塗りつぶしたフォームのスキャンと、文書定義エディタの同じフォームの空白のサンプルの画像を組み合わせるプロセス。
P
ページ
紙文書のページ画像とその処理結果。
ページレイアウト
画像上でフィールドの位置を表示するスキーム。
ページの向き
標準の配置に相対的なページの場所:上から下、左から右。ページの方向は、ページ画像の認識中に自動的に決定させることもできます。その目的のため、ABBYY FlexiCapture では考えられる方向を指定できます。
画像
機械による読み取りが可能なフォームの要素で、認識の対象ではないものの、グラフィックオブジェクト(ファイルなど)形式でエクスポートされる目的を持つもの。
画像フィールド
写真を含んでいる文書定義画像。
適合率
自動分類の質をユーザーが評価するために使用する特性です。正確に識別されたクラスA文書の数を、クラスAと識別された全文書(正しい識別も誤った識別も含めます)の数で除して算出します。
予備認識
文書定義によるフィールド検出を容易にするための文書画像のフルテキスト認識。
処理能力
特定の期間に処理されたページ、文書、またはバッチの平均数。
処理段階
文書またはバッチに対して特定のアクションが実行されるワークフローステージ(自動的にまたはオペレータによって)詳しくは、処理ステージおよびキュー。
禁止文字
認識中のデータには発生しないことが確実である文字。
詳細...
プロジェクト
プロジェクトとは、文書定義やインポートプロファイルなどの処理に必要となる文書バッチと設定を結び付ける単一環境のことです。詳しくは、プロジェクトの作成。
Q
キュー
タスクやバッチにグループ化されたドキュメントで、特定の処理ステージでの処理を待っているもの。詳しくは、処理ステージおよびキュー。
R
ラスターフォーム
情報フィールドが、以下によって区切られた長方形からなるグレーの背景に対して白い四角形として表される形式:ラスターラインまたは表によって区切られた長方形からなるグレーの背景に対してラスターライン。
ラスターライン
等間隔のドットからなる線。
再現率
自動分類の質をユーザーが評価するために使用する特性です。正確に識別されたクラスA文書の数を、クラスAの全文書の総数で除して算出します。
認識
画像の要素を特定の文字とマッチングさせるプロセス。
認識
認識時に ABBYY FlexiCapture がベースとする言語。
参照クラス
参照クラスとは、手動分類中に専門家によって文書に割り当てられるクラスです。文書のセクションは、文書の改訂版と同様に参照クラスになることができます。
参照レイアウトの形式で含まれています
自動的に作成されたレイアウトの参照として使用されるユーザ作成のレイアウト。この比較は、プログラムがフィールド領域をどれだけうまく検出したかを評価するために役立ちます。
正規表現
単語の構造、または特殊な言語を使用って入力された値の記述。プログラムでは、許容文字のセットだけでなく、フィールドコンテンツの構造も指定できます。テキストフィールドに制約を設定する時やカスタムデータタイプを作成する時に、その構造を正規表現で構造を記述することができます。詳しくは、正規表現で使用されるアルファベット。
解像度
画像のパラメータ。解像度は 1 インチあたりのドット数(DPI)で測定されます。
結果クラス
結果クラスとは、自動分類中に文書に割り当てられるクラスです。
ルール検証
事前設定のルールに基づく、認識されたデータの自動チェック。詳しくは、ルール検証。
ルール
フィールドのデータに課され、プログラムによって自動的にチェックされる一定の条件。詳しくは、ルール検証。
S
スキャン
スキャナを使って紙のフォームの電子画像を取得するプロセス。
セクション
抽出可能なフィールドのセットを含む文書の論理的に異なる部分。セクションは、ページからの文書の組み立てなど、認識プロセス中にさまざまな目的で使用されます。セクションには単一のページまたは複数のページを含めることができ、固定または柔軟にすることができます。詳しくは、複数ページの文書定義の作成。
文書構造の
含まれる情報フィールドセットのデザイン、数字、レイアウトがインスタンスごとに大幅に異なる文書。詳しくは、ABBYY FlexiCapture を使用して処理される文書のタイプ。
セパレータ
機械による読み取りが可能なフォームの要素で、縦線や横線を表します。
サービスフィールドを作成します
文書画像に領域がないフィールド。サービスフィールドの値は、プロパティに表示されているソースからのデータに基づいて自動的に決定されます。詳しくは、サービスフィールド。
許可可能な文字セット
認識中のデータタイプで発生する文字のセット。
詳細...
シンプルテキスト
テキストマーキングの種類で、テキストが区切り文字なしでブロックに挿入されます。
シングルフローデータ入力
アナログ(印刷)文書、およびデジタル(スキャン画像)文書からの自動データ抽出。
シングルフロー文書入力
ハードコピー文書の電子フォームへの自動変換。
SLA(サービスレベル契約)
ITサービスの提供を規定する契約。ABBYY FlexiCapture 12では、SLA契約が処理バッチの期限を管理します。
静的エレメント
文書定義のマッチングと識別を目的とする認識不可能な要素。要素の例:アンカー,アンカーテキスト,セパレーター,アンカーバーコード。
まとめセクション
まとめセクションは、文書セット内のすべての主要フィールドを表示する文書定義セクションです。これにより、オペレータは、1つの場所ですべてのエラーと信頼性の低いデータを表示し、各文書を開く代わりにレビューする必要がある文書のみを開くことができるため、セット内の文書を簡単に確認できます。
T
表
表示されるとは限らない 2 次元グリッドに配置されるデータ。プログラムによって、同種のデータを持つデータと反復行を持つ列で構成されるテーブルが処理されます。
テーブルフィールド
テーブルを含んでいる文書定義フィールド。テーブル列がそれぞれテキスト、チェックマーク、バーコード、画像など同じ種類のフィールドセットを表す複合フィールドです。
タスク
一緒に処理されるバッチからの文書のセット。プロジェクト設定や処理ステージによって、タスクに含まれる文書の数が異なる場合があります。特定の処理ステージでバッチ全体の処理が必要な場合は、そのバッチ全体がタスクに含まれます。検証タスクが自動的に形成される場合、各タスクには 10 個の文書が含まれます(バッチに含まれる10 個未満の未検証文書はすべて 1 つのタスクとして処理されます)。
テナント
他のユーザーから独立して使用できるABBYY FlexiCaptureの独立したインスタンス。
テストバッチ
文書定義のテストや設定のために設計された文書バッチ。文書バッチのローカルコピーはテストバッチの処理に使用されます。詳しくは、文書バッチ。
テキストフィールド
フォームへのテキスト入力用に設計された、機械による読み取りが可能なフォーム要素。
テキストフィールドのマーキング
テキストフィールドを区切るグラフィック要素。フレーム、コーム、線など。
テキストのマーキング
テキスト入力を目的とするページ領域の設計。入力フィールド入力フィールドトピック。
テキストの方向
ページに相対的なフィールドのテキストの方向。
テキスト認識 (OCR、ICR)
グラフィック画像のテキストへの変換。
テキストサンプル
すべてアルファベット文字のサンプルを含んでいるファイル。
トレーニング [文書の定義]
またABBYY FlexiCapture for Invoicesの機能で、ユーザーは特定の種類の請求書からデータを取り込むようにプログラムをトレーニングできます。トレーニングによって、データキャプチャの品質が向上します。トレーニングはプログラムの設定やインボイスの処理で実行できます。
トレーニングバッチ
特定の文書バリアントに対する文書のトレーニングやテストで使用される文書のバッチのことです。トレーニングバッチで文書定義のトレーニングを行うと FlexiLayout バリアントが作成されます。以下も参照:文書のバッチ,文書のバリアント,FlexiLayout バリアント。
タイプライター
認識可能なテキストのタイプで、タイプライターで入力されたテキストを表します。
U
下線付きテキスト
テキストマーキングの種類で、下線がテキストを区切ります。
表示...
ユーザー辞書
内蔵の辞書に含まれていない語が含まれているユーザー作成の補助辞書。内蔵の辞書をユーザー辞書で補完し、データキャプチャの品質を改善できます。ユーザー辞書には通常、特殊な用語、略語、会社名などが含まれています。
非認識可能部分
認識から除外された画像の領域。認識不可能な領域は、フィールド認識を困難にする説明テキストや画像を持つ領域を除外するために必要です。詳しくは、認識からの領域の除外。
構造化されていない文書
自由形式で表現された情報を含んでいる文書。例として、契約書、手紙、注文、グラフなどがあります。詳しくは、非構造化文書および半構造化文書の文書定義の作成。
V
ベンダー
商品やサービスを販売する法人または自然人。ベンダーは、商品やサービスについてインボイスを発行します。インボイスのデータは次を使ってキャプチャします→ABBYY FlexiCapture for Invoices。
検証
検証は、データが認識されていること、ページが文書に正しく組み立てられていること、およびルールにエラーが返されていないことをチェックすることです。検証は、データ検証ステーション(認識精度を検証)と検証ステーション(あらゆる種類のチェックを実行)で行われます。詳しくは、検証。
W
作業バッチ
データ入力を目的とする文書バッチ。作業バッチの処理に使用できるのは、発行された文書定義のみです。詳しくは、文書バッチ。
書き込みスタイル
特定のグループにのみ当てはまる書き方。たとえば、米国式の数字の表記方法などです。
詳細...
X
XFD
XML フォーム定義(*.xfd)の以下で設計されたフォームの特別なファイル形式:ABBYY FormDesigner。XMLフォーム定義フォーマットファイルは、以下で文書定義を作成するために使用されます:ABBYY FlexiCapture。
4/12/2024 6:16:06 PM