パターン学習
認識したいドキュメントに、プログラムが知らない装飾的なフォントまたは特殊文字(例:数学記号など)が含まれる場合、パターン学習を使用してOCR精度を改善することを推奨します。パターンは、テキストに登場する通りの画像をキーボード上で対応するものと関連付けることにより作成されます。プログラムが認識できない文字の画像を示したときに、適切なキーを押すだけで実行されます。コンピュータは人の目では確認できない文字画像同士の微細な違いを検出します。そのため、時には複数回同一の文字をキーボードで確認しなければならない場合もあります。これはパターン学習と呼ばれ、文字セット画像と対応するキーボードとの関連性を効果的に高めます。
学習モードをこれ以外のケースで使用することは推奨されません。学習にかかる時間と労力とを比較しても、OCR品質におけるメリットはほんのわずかであることがその理由です。
パターン学習はアジア系言語には対応していません。
学習モードでは、ユーザーパターンが作成されます。これはテキスト全体でOCRを実行する場合に使用することができます。
OCR処理を開始する前に新たに作成したパターンを編集したいと考えるかもしれません。正しくない学習パターンはOCRの品質に悪影響を及ぼす可能性があります。パターンには、文字または合字の全体のみを含む必要があります。切れた文字や正しくない文字の組み合わせは、パターンから削除する必要があります。
パターンの作成と編集
パターン学習
パターン学習に関する重要な情報
- OCRエンジンは複数の特定文字画像をそれぞれ区別することはなく、同一のキーボード文字に関連付けます。例えば、直線アポストロフィ(')と引用符の左側(‘)、引用符の右側(‘)はすべてキーボードの直線アポストロフィ(')に関連付けられます。つまり、パターン学習モードで引用符の右、左記号をそれぞれのキーボード文字を入力しても、それらは認識テキストとして再現されることはないということです。
- 一部の文字画像では、OCRエンジンはキーボードの対応するキーを、より大きなコンテキストに基づいて選択します。例えば、円の画像はゼロまたはアルファベットのOとして認識され、OCRエンジンはその前後の文字を参照して、この2つうちのいずれかを選択します。円が数字に囲まれていたら、プログラムはゼロだと判断し、そうでない場合には、円をアルファベットのOだと解釈します。
- 学習したパターンは同一フォントタイプとサイズで印刷され、パターンを学習したときと同一の解像度で画像としてスキャンされた画像の認識テキストにのみ使用されます。
参照:
3/26/2024 1:49:51 PM