拡張正規表現
フォーマットの指定には拡張正規表現を使います。
拡張正規表現には以下が含まれます:
- 特殊括弧[% および %]。括弧内の文字はよくある OCR エラーで補足されます。
たとえば [%S%] は、S、$、5 である可能性があります。 - [%...%][%...%]一般的文字セットおよび OCR エラー用です:
- LETTERS-大文字ラテン文字、および大文字ラテン文字として一般的に認識される文字
- DIGITS-数字、および数字として一般的に認識される文字
- LETERSANDDIGITS-大文字ラテン文字、数字、そして大文字ラテン文字および数字として一般的に認識される文字。
たとえば[%DIGITS%]{9}は、9 桁の数字の列か、OI234Sb7B9 のように数字でよく発生する OCR エラーを指定します。
12.04.2024 18:16:25