Japanese (日本語) - Change language

単一行の静的テキスト要素の検索

静的テキストの文字列を検出する必要があり、すべての画像でこのフィールドに1行しかないとわかっている場合は、スペースを入れずにテキスト値を入力することをおすすめします。これで検索の速度が上がります。発見される仮説の質には影響を及ぼしません。

注意: これは、名前の静的テキストがエラーなしで認識された場合にのみ当てはまります。これは最大エラー数( 静的テキスト 要素で2つのパラメータにより設定: 最大エラー数 および 最大エラー割合 )は単語のエラー数を意味するためです。従って、 最大エラー数 が1に設定され、名前が3単語で構成され、静的テキストの値がスペースなしで入力されている場合、認識中に1つ以上の間違いは起こりません。スペースなしで入力すると、名前の実際の単語数に関係なく、単一単語として認識されます。名前の単語をスペースで区切ると、検索テキストフィールドに入力したそれぞれの単語に、エラーの許容数または許容割合が適用されます。静的テキストで誤認識が生じた場合、仮説は特定のアルゴリズムに従ってペナルティを科され、仮説の質はスペースの有無に応じて異なるかもしれません。

静的テキスト要素での作業方法を Spaces.fsp プロジェクトで見ていきましょう(フォルダ %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks\Spaces in StaticText\Project1 ) 。

プロジェクトには2ページあります:

  • ページ1 – 画像の質は良好;
  • ページ2 – データフィールドの名前にノイズあり。

名前「父親の名前をここに記載してください:」に関連するデータフィールド「父親の名前」を検索します。

プロジェクトで、種類 静的テキスト の要素を作成して名前を NameOfFatherHeader と付けます。その値をスペースのない1つの単語として指定しました(すなわち Pleaseindicateyourfather'snamehere: )。名前の大文字小文字は関係ありません。要素の他のすべてのプロパティのデフォルト値をそのまま残しました。名前の最大エラー数は10文字です(35文字テキストで30%)。

合致コマンドを選択してFlexiLayoutの合致手順を実行すると、両方のページで名前が正常に検出されていることがわかります。ですが、ページ2では、要素仮説の チェーンの品質 が約0.994です。文書のノイズによって引き起こされる認識エラーに対してペナルティが科されているためです。

注意: 検索された名前の事前認識結果を表示するには、ツールバーで「 L 」(「 認識された行を表示 」)をクリックして、名前のテキストを指します。ページ2のフィールド名の事前認識結果は、以下のようになります:"PLEASEINDICATE|OURFATHER'SNAMEHERE:".または、 仮説ツリー ウィンドウの NameOfFatherHeader 要素の仮説を選択し、マウスポインタを プロパティ-仮説 ウィンドウの行 キーワード に移動して、検出済みの静的テキストを表示します。この場合、事前認識結果と検出エラー(ある場合)は、 プロパティ-仮説 ウィンドウの下部に表示されます。

データフィールド「父親の名前」を検出するために、種類 文字列 の要素を作成しました。求められるデータフィールドは1行のみで、その値は、 静的テキスト とは異なり、文書によって変化するためです。要素 FathersName に名前を付け、そのプロパティを 関係 セクションで指定しました。次に、FlexiLayoutに同じ名前のブロックを作成して、その区域が FathersName 要素の区域と一致するように指定しました( ソース要素 フィールドで要素 FathersName の名前を選択しました)。

FlexiLayoutを同じ画像と合致させてみましょう。 NameOfFatherHeader 要素の値はスペースで区切られた単語として入力します。

このために、 Spaces.fsp プロジェクトを作成しました( Spaces in StaticText\Project2 フォルダ)。要素 NameOfFatherHeader の値は以下のようになります: Please indicate your father's name here: .他のどの設定も変更されません( Spaces in StaticText\Project1 フォルダの Spaces.fsp プロジェクトの設定と同じです)。

合致 コマンドを選択してFlexiLayoutの合致手順を実行すると、両方のページでフィールド名が正常に検出されていることがわかります。ですが、ページ2では、 NameOfFatherHeader 要素の仮説の チェーンの品質 は、初期画像の低い質によって引き起こされる1つの認識エラーが原因で仮説にペナルティが科されたために、約0.987になっています。

注意: 検索テキスト フィールドに入力する静的テキスト値にスペースがある場合、各単語が個別に分析され、エラーの最大数または最大割合が各単語に適用されることに注意してください。静的テキスト仮説の最終的な質は、これらの個別の単語の質によって変わります。

11/10/2020 12:08:07 PM


Please leave your feedback about this article