HTML出力フォーマット設定ダイアログボックス

このダイアログボックスでは HTML フォーマット設定を指定できます。

認識されたテキストを HTML ファイルに保存するパラメータを設定します:

オプション名 オプションの説明
レイアウトを保持する グループ

レイアウトを保持する

(ドロップダウンリスト)

レイアウトの保持を設定 次の選択肢が使用できます:

  • ページ全体のレイアウトを保持する
    認識結果を元の文書と まったく同じ見かけにしたい場合にはこのオプションを選択します。
  • フォントとフォントサイズを保持する
    このオプションはパラグラフやフォントのタイプおよびサイズを保持します。 パラグラフの中のテキストフォーマッティングは保持されません。
  • すべての書式を削除する
    元の文書のコンテンツは必要であるが、文書のレイアウトを保持する必要はない場合にこのオプションを選択します。
画像を保持する

認識されたテキストで画像を保持する場合にはこのオプションを選択します。

デフォルトではこのオプションが設定されています。

注:出力ファイルで画像が保存されるフォーマットは 2 つの画像プロパティに基づき自動で選択されます: カラータイプ(モノクロ、グレースケールまたはカラー)およびカラーバラエティ(低または高)。 モノクロ画像は常に PNG フォーマットで保存されます。 グレースケールおよびカラー画像はカラーバラエティが低い場合は、PNG フォーマットを使って、また、カラーバラエティが高い場合は、JPEG フォーマットを使って保存されます。

形式 グループ
CSS を使用する このオプションを選択すると、ビルトインスタイルシート(CSS)が使用されます。 CSS は Internet Explorer 4.0 以上が必要です。
ヘッダーとフッターを維持する

ソースドキュメントにヘッダーやフッターがある場合、このオプションを選択するとページの上部にヘッダー、ページの下部にフッターを追加します。このオプションを選択していない場合、ヘッダーやフッターは追加されません。このオプションは、1枚の文書からページ番号を取り除きたい場合に便利です。

注:デフォルトではこのオプションが有効になっています。

文字のエンコード グループ

エンコードタイプ

(ドロップダウンリスト)

出力ファイルのエンコードのタイプを指定しま:

  • シンプル
    シンプルエンコード、シンボルごとに 1 バイトv
  • Unicode UTF-16
    ネイティブ Unicode フォーマット 1 つのシンボルが 2 バイトシーケンスで表現されます。
  • Unicode UTF-8
    Unicode UTF-8 フォーマット。 UTF-8 は、バイトのストリングを使って ASCII テキスト(<=U+007F) が 1 バイトのまま変更されずに残る 16 ビット Unicode ストリングを表します。 U+0080-07FF(ラテン語、ギリシャ語、キリル文字、ヘブライ語、アラビア語含む)およびU+0800-FFFF(中国語、日本語、韓国語、その他)は 3 バイトシーケンスになります。

コードページ

(ドロップダウンリスト)

デフォルトでコードページは自動で検出されます。(自動)値を選択して、自動検出を使用します。 必要な場合にはコードページを手動で選択し、リストから必要な値を選択します。
既存のドキュメントメタデータを削除 タイトル、作成者、タグなどを含む元のメタデータをドキュメントから削除します。

こちらも参照してください:

出力フォーマット設定ダイアログボックス

29.11.2022 17:26:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.