Erweiterte reguläre Ausdrücke
Formate werden mithilfe erweiterter regulärer Ausdrücke festgelegt.
Erweiterte reguläre Ausdrücke beinhalten die folgenden Ergänzungen:
- Spezialklammern [% und %]. Die Zeichen innerhalb der Klammern werden durch gängige OCR-Fehler ergänzt.
Beispiel: [%S%] erlaubt S, $ und 5. - Spezielle Wörter innerhalb von [%...%] für allgemeine Zeichensätze und OCR-Fehler:
- LETTERS - Lateinische Großbuchstaben und Zeichen, die im Allgemeinen als lateinische Großbuchstaben erkannt werden
- DIGITS - Ziffern und Zeichen, die im Allgemeinen als Ziffern erkannt werden
- LETERSANDDIGITS - Lateinische Großbuchstaben, Ziffern und Zeichen die im Allgemeinen als lateinische Großbuchstaben und Ziffern erkannt werden
Beispiel: [%DIGITS%]{9} legt neun aufeinanderfolgende Ziffern oder allgemeine OCR-Fehler für Ziffern fest, wie z. B. "OI234Sb7B9".
12.04.2024 18:16:01