Japanese (日本語)

事前認識パラメータ

FlexiLayoutおよび分類子には、認識言語、テキスト型、事前認識モードおよび領域などの事前認識設定を含む、さまざまなユーザー定義設定があります。適切な事前認識設定を選択することで、文書の処理に適したFlexiLayoutと分類子の作成に役立てることができます。

事前認識設定を、事前認識プロパティダイアログボックスで変更することができます。ダイアログボックスを開くには:

  • FlexiLayoutまたは分類子メニュー、またはFlexiLayoutまたは分類子のショートカットメニューで、プロパティ...をクリックします。
  • %Name%のプロパティダイアログボックスの全般タブで、高度な事前認識プロパティ...ボタンをクリックします。

事前認識プロパティダイアログボックスが開きます。このダイアログボックスで使用できるオプションは以下の通りです。

オプション 記述
全般タブ
名前

文書のテキストの印刷に使用された方法:

  • 字体,
  • マトリクスプリンター,
  • タイプライター

これらのオプションを選択する前に、テキストの型を割り出し、その質を評価します。

事前認識モード
  • 高速モード。カラー画像およびハーフトーン画像は、認識の前にバイナリー化されます (つまり、白黒に変換されます)。高速認識にかかる時間が短く、ぼ満足のいく結果が得られます。
  • バランスモード。さらに、プログラムでは、画像の色も考慮されます。このモードでは、認識速度は遅くなりますが、品質が向上します。
    注意:バランス 認識モードのアルゴリズムについては、速度、品質ともに最高の数値が得られているため、これ以降の改良は予定されていません。
  • 通常モードはデフォルトです。また 高速 / バランスモードでの事前認識が複数のエラーを引き起こす場合にも推奨されます。
  • 正確モードは、ほとんど読み取れないデジタル画像や質の悪い文書からデータを抽出することを目的としています。
    注意: 正確モードは最も時間がかかるため、問題のある画像/文書でのみ使用することをお勧めします。
言語タブ
テキスト言語 文書で使用される言語。ドロップダウンリストから1つまたは複数の言語を選択できます。使用可能な言語の詳細は、ABBYY FlexiLayout™ StudioでサポートされているOCR言語をご覧ください。
ユーザー辞書 このオプショングループで、ユーザー辞書を追加できます。ユーザー辞書は、内蔵辞書に特別な語彙、略語、企業名などを補足して、認識の質を高めるために使用されます。
高度タブ
バーコード

このグループには2つのバーコード処理オプションがあります:

  • バーコード抽出を無効にする – 画像にバーコードが表示しない場合は、このオプションを選択します。これで文書認識がかなり早くなります。
  • 2Dバーコードを抽出: データマトリックス、Aztec、QRコード – 処理する画像にデータマトリックス、Aztec、QRコードのバーコードが含まれている場合は、このオプションを選択します。このオプションが無効だと、これらのバーコードは画像で検出されず、バーコード要素のプロパティで使用できません。
  • Extract post barcodes – 画像にオーストラリア郵便公社などの郵便バーコードが含まれている場合は、このオプションを選択します。このオプションが選択されていないと、郵便バーコードは画像には見つからず、バーコード要素のプロパティで使用できません。
    重要! 郵便バーコードを抽出すると、認識が遅くなります。
CJK

中国語、日本語、韓国語の処理のオプションもあります。

  • セパレートふりがなモード– このオプションを選択して、日本語の振り仮名付きのテキストを処理する時に認識の質を高くします。
NER認識

固有表現抽出ー このオプションを選択して、NLP法を使用し、フィールドまたはフィールドグループから意味のある情報を抽出します。

注意:このオプションは、NLP モジュールを含むライセンスがないと使用できません。

縦書きテキストの抽出

縦テキスト抽出パラメータ:

  • すべての言語で抽出– サポートされている言語で書かれた垂直方向のテキストを検出します。
  • 抽出しない– 垂直方向のテキストの検出を防ぎます。
  • 中国語・日本語・韓国語の場合に抽出– 中国語、日本語、韓国語で縦書きで書かれたテキストを検出します。
事前認識領域 事前認識する領域。ページの端部に関連する事前認識領域の位置を指定できます。
ユーザーパターン このオプションを使用すると、PTNまたはFBT形式でユーザーパターンを追加できます。文書に非標準的なフォントや文字が含まれている場合は、このユーザーパターンを使用することをおすすめします。

12.04.2024 18:16:07

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.