DocumentToIndexPageオブジェクト

DocumentToIndexPageオブジェクト

このオブジェクトはインデックスを作成する文書のページを表します。文書の識別やスクリプトのインデックス作成に使用されます。ABBYY FineReader Server はページを認識する時にまずそのレイアウトを分析し、ページにあるさまざまなタイプのブロックを検出します。ブロックは画像エリアをどのように、どの順番で認識されるかを決定し、認識処理後に認識されたテキストを含みます。TextBlocksTableBlocksBarcodeBlocksプロパティを使って、対応するブロックの認識されたテキストやページのブロック位置にアクセスできます。

プロパティ

名前 タイプ 説明
BarcodeBlocks BarcodeBlocks、読み込みのみ ページレイアウトのすべてのバーコードブロック。
Height Long、読み込みのみ レイアウトの高さ(ピクセル)
PageIndex Long、読み込みのみ 文書のページインデックス。最初のページのインデックスは0です。
PageNumber Long、読み込みのみ 文書のページ数。最初のページの数は1です。
Resolution Long、読み込みのみ レイアウト解像度。
Statistics Statistics、読み込みのみ ページ処理統計。
TableBlocks TableBlocks、読み込みのみ ページレイアウトのすべてのテーブルブロック。
Text String、読み込みのみ すべてのブロックの連結テキストを含む文字列。
TextBlocks TextBlocks、読み込みのみ ページレイアウトのすべてのテキストブロック。
Width Long、読み込みのみ レイアウトの幅(ピクセル)。

方法

名前 説明
RedactRegion( [in] IRegion* region )  リージョンブロックを編集します。
RedactAttribute( [in] IAttribute* attribute ) インデックスフィールドを編集します。
RedactRect( [in] IRectangle* rect ) 指定された座標矩形を編集します。
ReplaceTextOnPage( [in] BSTR what, [in] BSTR with, [in, defaultvalue(0)] VARIANT_BOOL ignoreCase )

選択したページで"what"を"with"に置き換えます。
ignoreCaseパラメータは大文字と小文字を区別しない検索に設定します(デフォルトでは大文字と小文字を区別するよう設定されています)。

重要事項!行の区切り(\n)とタブ(\t)は、"what"と"with"の引数として使用できません。

こちらも参照してください:

DocumentToIndexPages

DocumentToIndex

26.03.2024 13:49:51

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.