Dialogfeld "HTML"

In diesem Dialogfeld können Sie Einstellungen im HTML-Format festlegen.

Sie können folgende Parameter zum Speichern des erkannten Texts in einer HTML-Datei festlegen:

Name der Option Beschreibung der Option
Bereich Layout übernehmen

Layout übernehmen

(Dropdownliste)

Legt die Beibehaltung des Layouts fest. Folgende Optionen sind verfügbar:

  • Seitenlayout vollständig übernehmen
    Wählen Sie diese Option aus, wenn die Erkennungsergebnisse genau wie das Originaldokument aussehen sollen.
  • Schriftart und -größe übernehmen
    Mit dieser Option werden Art und Größe der Absätze und Schriften beibehalten. Die Textformatierung in Absätzen wird jedoch nicht beibehalten.
  • Formatierung vollständig entfernen
    Wählen Sie diese Option aus, wenn der Inhalt, jedoch nicht das Layout des Originaldokuments übernommen werden soll.
Bilder beibehalten

Wählen Sie diese Option aus, damit Bilder im erkannten Text übernommen werden.


Diese Option ist in der Standardeinstellung ausgewählt.

Hinweis. Das Format, in dem Bilder in der Ausgabedatei gespeichert werden, wird anhand der folgenden beiden Bildeigenschaften automatisch ausgewählt: Farbtyp (Schwarz-Weiß, Graustufen oder Farbe) und Farbvielfalt (gering oder hoch). Schwarz-Weiß-Bilder werden immer im PNG-Format gespeichert. Graustufen- und Farbbilder werden bei geringer Farbvielfalt im PNG-Format und bei hoher Farbvielfalt im JPEG-Format gespeichert.

Bereich Format
CSS verwenden Wenn Sie diese Option auswählen, wird das integrierte Stylesheet verwendet. Zur Ansicht von in diesem Modus gespeicherten Dokumenten ist Internet Explorer 4.0 oder eine spätere Version erforderlich.
Kopf- und Fußzeilen beibehalten

Wenn das Quelldokument eine Kopf- und/oder eine Fußzeile enthält, wird bei Auswahl dieser Option die Kopfzeile oben auf der Seite und die Fußzeile unten auf der Seite eingefügt. Wenn diese Option nicht ausgewählt ist, werden die Kopf- und Fußzeile nicht hinzugefügt. Diese Option ist nützlich für Dokumente mit Seitennummerierung, die Sie in Ihrem einseitigen Dokument weglassen möchten.

Hinweis. Diese Option ist standardmäßig aktiviert.

Bereich Zeichenkodierung

Kodierungstyp

(Dropdownliste)

Gibt den Kodierungstyp der Ausgabedatei im HTML-Format an:

  • Einfach
    Einfache Kodierung, 1 Byte pro Symbol
  • Unicode UTF-16
    Natives Unicode-Format, bei dem jedes Symbol durch eine 2-Byte-Folge angegeben wird
  • Unicode UTF-8
    Unicode UTF-8-Format. UTF-8 ist eine Codeseite, bei der eine 16-Bit-Unicode-Zeichenfolge mit einer Bytezeichenfolge angegeben wird und ASCII-Text (<=U+007F) als einzelnes Byte unverändert bleibt. U+0080-07FF (einschließlich Latein, Griechisch, Kyrillisch, Hebräisch und Arabisch) wird in 2-Byte-Sequenzen konvertiert und U+0800-FFFF (Chinesisch, Japanisch, Koreanisch u. a.) in 3-Byte-Sequenzen.

Codeseite

(Dropdownliste)

In der Standardeinstellung wird die Codeseite automatisch erkannt. Wählen Sie den Wert (Automatisch) aus, damit die automatische Erkennung verwendet wird. Sie können die Codeseite dennoch bei Bedarf manuell auswählen. Wählen Sie dazu den entsprechenden Wert in der Liste aus.
Vorhandene Dokument-Metadaten entfernen Entfernt die ursprünglichen Metadaten aus dem Dokument, einschließlich Titel, Autor, Tags usw.

Weitere Informationen

Dialogfeld "Ausgabeformateinstellungen"

26.03.2024 13:49:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.