Japanese (日本語) - Change language

文字列要素の仮説

正規表現が要素のプロパティで指定されている場合、検索領域で正規表現の条件を満たす文字列が検索されます。正規表現が指定されていない場合、ユーザー定義アルファベットが使用されます。

検索領域と水平に交差するすべてのテキストオブジェクトが考慮されます(オブジェクトは検索領域内に垂直にすべて収まる必要があります)。次に、テキストオブジェクトは行にグループ化されます。ラインは左から右へ構築されています。最大スペース長さ(最大スペース長さプロパティで設定)を超えると行の構築は止まります。

結果の行で、文字列は識別され、各文字列にはユーザー定義アルファベットの文字のみが含まれます。同様に、行は断片に分割されます。

次に、各断片の仮説が立ちます。オプションが埋め込み仮説を許可選択されているかによって、仮説は2つの異なる原則で立ちます。

前の段階で3つの断片が検出されたとします。もし埋め込み仮説を許可オプションが選択されているのであれば、仮説は以下のように立ちます:

hypothesis 1: fragment 1

hypothesis 2: fragment 1 + fragment 2

hypothesis 3: fragment 1 + fragment 2 + fragment 3

hypothesis 4: fragment 2

hypothesis 5: fragment 2 + fragment 3

hypothesis 6: fragment 3

各仮説で、各アルファベットの文字の部分がフィールドで設定された値を超えないことがアルファベット文字の割合確認されます。同様に、非アルファベット文字の割合がフィールドで設定された値を超えないことが非アルファベット文字の割合確認されます。少なくとも1つの確認が否定されると、仮説は立ちません。

もし埋め込み仮説を許可が選択されていないのであれば、上のリストに埋め込まれた仮説は破棄されます。埋め込まれた仮説は、上のリストの別の仮説の中に含まれている仮説です。すべての仮説で確認が肯定されると、以下の仮説のみが残ります: fragment 1 + fragment 2 + fragment 3。

従って、もし埋め込み仮説を許可オプションが選択されていないのであれば、すべての条件を満たす最大長さの仮説が立ちます。埋め込まれた仮説が除外されても、仮説は交差する可能性がああります。これは、独立した文字または単語、または個別の仮説が立っていない他の仮説の一部の文字列かもしれません。例えば、2つの仮説(すなわち2つの文字列)が立つ可能性があります。1つは特定の単語またはフレーズで終わり、もう1つはその単語またはフレーズで始まります。

例えば:

hypothesis 1: fragment 1 + fragment 2

hypothesis 2: fragment 2 + fragment 3

一度可能な仮説が作られるとプログラムはそれぞれ計算し検索前品質(仮説が以下に設定された検索制限にどのくらい合うかの見積もりです。プロパティダイアログボックスで選択されたオプションに沿って実行されます文字列タブ高度タブのある高度な検索前関係フィールド)に表示されます。このステージで、文字の仮説長さがプロパティで特定されているあいまいインターバル内に入るかどうか、文字カウントライン内全ギャップの長さがTotalGapLength で特定されているあいまいインターバル内に収まっているかどうか、そしてライン内のワード数が単語カウントプロパティに特定されているあいまいインターバル内に収まっているかどうかに基づいて品質が算出されます。

仮説の全体的な品質は、すべての品質を乗算して算出されます。

A文字列仮説には以下のプロパティがあります:

プロパティ 記述
要素名 要素の完全な名前。
ページ 要素が検出されたページの番号。
矩形囲み 仮説区域周囲の矩形の座標。
仮説区域の幅。
高さ 仮説の区域の高さ。
テキスト 仮説の文字
検出済み 要素に記述されたオブジェクトが見つかったかどうか(true)または帰無仮説が立ったかどうか(false)を示します。
最良パスから 見つかった仮説が仮説ツリーのベストパスに属するか(true)またはそうでないか(false)を示します。
検索前品質 仮説が要素のプロパティにどのくらい合うかは特定されたプロパティフィールドのコードによるダイアログボックスによって高度な検索前関係確認されます。
検索後品質 フィールドの条件後仮説の品質が高度な検索後関係適用されます。
チェーンの品質 グループの最初のサブ要素から現在のサブ要素までの仮説連鎖の質。連鎖の質は、連鎖のすべてのサブ要素の質を乗算して計算され、ライバルの仮説連鎖の比較に使用されます。

詳細:

文字列

検索領域

追加的な検索制限

09.10.2020 8:50:46


Please leave your feedback about this article