Glossar

A

ABBYY FineReader Task ist eine Reihe aufeinanderfolgender Schritte, die das Programm für die Verarbeitung eines Dokuments durchführen muss. ABBYY FineReader 14 enthält eine Reihe integrierter Tasks für die wichtigsten Szenarien der Verarbeitung von Dokumenten. Die Benutzer können aber auch ihre eigenen Tasks erstellen. Integrierte Tasks können im Fenster Neuer Task gestartet werden.

ABBYY Hot Folder ist ein Planungs-Agent, mit dem Sie einen Ordner mit Bildern und den Verarbeitungszeitpunkt für diese gespeicherten Bilder festlegen können. ABBYY FineReader wird die Bilder aus dem ausgewählten Ordner automatisch verarbeiten.

ABBYY Screenshot Reader ist eine Anwendung, mit der Sie Screenshots erstellen und die darin enthaltenen Texte erkennen können.

Abkürzung ist die Kurzform eines Wortes oder Ausdrucks (z. B. MS-DOS für Microsoft Disk Operating System, UN für United Nations etc.).

ADF (Automatic Document Feeder) ist ein Gerät, das Dokumente automatisch einem Scanner zuführt. Scanner mit ADF können ohne manuellen Eingriff mehrere Seiten verarbeiten. ABBYY FineReader unterstützt die Arbeit mit mehrseitigen Dokumenten.

ADRT® (Adaptive Document Recognition Technology) ist eine Technologie zur Erhöhung der Konvertierungsqualität bei mehrseitigen Dokumenten. Sie kann z. B. strukturelle Elemente erkennen, wie Überschriften, Kopf- und Fußzeilen, Fußnoten, Seitennummerierung und Signaturen.

Aktiver Bereich ist ein Bereich, der auf einem Bild aktuell markiert wurde und nun gelöscht, verschoben oder bearbeitet werden kann. Um einen Bereich zu aktivieren, klicken Sie darauf. Der Rahmen des aktiven Bereichs ist fett formatiert und enthält Anfasser, die zur Änderung der Größe des Bereichs an eine andere Position gezogen werden können.

Aktivierung ist der Vorgang, bei dem ein bestimmter Code von ABBYY abgerufen wird, der es dem Benutzer ermöglicht, seine Version des Produkts auf dem gegebenen Computer im vollen Umfang zu nutzen.

Auflösung ist ein Scanparameter, gemessen in Dots per Inch (dpi). Texte mit einer Schriftgröße ab 10 pt sollten mit einer Auflösung von 300 dpi, kleinere Schriftgrößen (9 pt und kleiner) mit einer Auflösung von 400-600 dpi gescannt werden.

Automatisierter Task: Eine taskverwaltende Komponente von ABBYY FINEREADER 14 für das Erstellen, Einrichten und Starten von Tasks in ABBYY FineReader.

B

Berechtigungskennwort ist ein Kennwort, das andere Benutzer daran hindert, ein PDF-Dokument zu drucken oder zu bearbeiten, es sei denn, sie geben das vom Autor festgelegte Kennwort ein. Wenn bestimmte Sicherheitseinstellungen für ein Dokument festgelegt wurden, können diese von anderen Benutzern nur nach Eingabe des Kennworts geändert werden.

Bereich ist ein Bildbereich, der von einem Rahmen umgeben ist und einen bestimmten Datentyp enthält. Vor dem OCR-Vorgang unterteilt ABBYY FineReader das Dokument in Text-, Bild-, Tabellen- und Strichcodebereiche, um festzulegen, welche Teile des Seitenbildes in welcher Reihenfolge erkannt werden sollen.

Bereichsvorlage ist eine Vorlage, die Informationen über Größe und Positionen der Bereiche in ähnlich aussehenden Dokumenten enthält.

Bildbereich ist ein Bildbereich, der eine Abbildung enthält. Dieser Bereichstyp kann richtige Bilder oder andere als Bild darzustellende Objekte enthalten (z. B. Textabschnitte).

C

Codeseite ist eine Tabelle, die Zuordnungen zwischen Zeichen und deren Codes herstellt. Die benötigten Zeichen können von den Benutzern aus dem Zeichensatz der Codeseite ausgewählt werden.

Zurück zum Anfang

D

Dokumentanalyse ist der Prozess der Identifizierung der logischen Struktur eines Dokuments und von Bereichen, die verschiedene Datentypen enthalten. Dokumentanalysen können automatisch oder manuell durchgeführt werden.

Dokumententyp ist ein Parameter, der dem Programm mitteilt, wie der Originaltext gedruckt wurde (z. B. mit einem Laserdrucker, mit einer Schreibmaschine etc.). Für mit Laserdruckern gedruckte Texte wählen Sie Autom., für Schreibmaschinentexte wählen Sie Schreibmaschine, für Faxe wählen Sie Fax.

dpi (Dots per Inch) ist eine Maßeinheit der Bildauflösung.

E

Erkennungsbereich ist ein Bildbereich, den ABBYY FineReader automatisch analysieren soll.

F

Farbmodus legt fest, ob die Dokumentfarben erhalten werden sollen oder nicht. Schwarzweiß-Bilder führen zu kleineren OCR-Projekten und können schneller verarbeitet werden.

H

Helligkeit ist ein Bildparameter, der den Weißanteil in einem Bild wiedergibt. Durch die Erhöhung der Helligkeit wird das Bild "weißer". Durch das Festlegen einer geeigneten Helligkeit wird die Erkennungsqualität verbessert. Siehe auch: Tipps für das Scannen.

Hintergrundbildbereich ist ein Bildbereich, der ein Bild mit einem darüber gedruckten Text enthält.

I

Ignorierte Zeichen sind in Wörtern erkannte Zeichen, die keine Buchstaben sind (z. B. Silbenzeichen oder Betonungszeichen). Diese Zeichen werden bei der Rechtschreibprüfung ignoriert.

Invertiertes Bild ist ein Bild mit hellen Zeichen vor dunklem Hintergrund.

K

Konstantschriftart ist eine Schriftart (wie Courier New) mit fester Breite für alle Zeichen. Für bessere OCR-Ergebnisse bei Konstantschriftarten wählen Sie auf der Registerkarte OCR des Dialogfelds Optionen die Option Schreibmaschine in der Optionsgruppe Dokumenttyp.

Kontextmenü ist das Menü, das angezeigt wird, wenn Sie mit der rechten Maustaste auf etwas klicken, wie z. B. einen Bereich oder einen anderen Teil eines Dokuments.

Kopf- und Fußzeilen sind Bilder oder Texte am oberen oder unteren Rand einer Seite. Kopfzeilen befinden sich oben auf der Seite und Fußzeilen unten.

Zurück zum Anfang

L

Ligatur ist eine Kombination aus zwei oder mehr scheinbar "zusammengeklebten" Zeichen wie beispielsweise e.g. fi, fl, ffi. Solche Zeichen sind für ABBYY FineReader schwer zu trennen. Darum lassen sich genauere OCR-Ergebnisse erzielen, wenn diese Buchstabenkombinationen gleich als eigenständige Zusammensetzungen behandelt werden.

Lizenzmanager (License Manager) ist ein zur Verwaltung von ABBYY FineReader-Lizenzen und zur Aktivierung von ABBYY FineReader 14 Corporate verwendetes Hilfsprogramm.

M

Muster ist eine Reihe von Verbindungen zwischen gemittelten Zeichenbildern und deren jeweiligen Namen. Muster werden dann erstellt, wenn Sie ABBYY FineReader anhand eines spezifischen Textes trainieren.

O

OCR (Optical Character Recognition) ist eine Technologie, die Computern das Lesen von Text, das Erkennen von Bildern, Tabellen und anderen Formatierungselementen ermöglicht.

OCR-Projekt ist ein von ABBYY FineReader erstelltes Projekt für die Verarbeitung eines Dokuments. Es enthält die Bilder der Dokumentseiten, deren erkannten Text (falls vorhanden) und die Programmeinstellungen.

OCR-Projektoptionen ist eine Gruppe von Optionen, die im Dialogfeld Optionen aktiviert/deaktiviert werden können (klicken Sie auf Werkzeuge > Optionen..., um dieses Dialogfeld zu öffnen). Zu diesen Optionen gehören auch benutzerdefinierte Sprachen und Muster. Die OCR-Projektoptionen können gespeichert und in anderen OCR-Projekten verwendet werden.

Öffnungskennwort ist ein Kennwort, das andere Benutzer daran hindert, ein PDF-Dokument zu öffnen, es sei denn, sie geben das vom Autor festgelegte Kennwort ein.

Omnifontsystem (Allschriftsystem) ist ein Erkennungssystem, das Zeichen in jeder Schriftart ohne vorheriges Training erkennt.

Optionaler Trennstrich ist ein Trennstrich (¬) , der anzeigt, wo genau ein Wort oder eine Wortkombination beim Erreichen des Zeilenendes getrennt werden soll (z. B. sollte "Autoformat" als "Auto-format" getrennt werden"). ABBYY FineReader ersetzt alle Trennstriche in Wörtern, die im Wörterbuch enthalten sind, durch optionale Trennstriche.

Zurück zum Anfang

P

Paradigma ist die Gesamtheit aller grammatikalischen Formen eines Worts.

PDF (Portable Document Format) ist ein gängiges Format für elektronische Dokumente. Eine PDF-Datei sieht immer gleich aus, egal auf welchem Computer sie angezeigt wird, da sie detaillierte Beschreibungen darin enthaltener Texte, Schriftarten und Grafiken aufweist.

PDF-Sicherheitseinstellungen sind Beschränkungen, die das Öffnen, Bearbeiten, Kopieren oder Drucken von PDF-Dokumenten verhindern. Dazu gehören Kennwörter zum Öffnen oder für Zugriffsrechte sowie Verschlüsselungsstufen.

Primärform ist die Wörterbuchform eines Wortes (Hauptwörter von Wörterbucheinträgen werden im Allgemeinen in ihrer Primärform angegeben).

Produkt-ID wird bei der Aktivierung von ABBYY FineReader auf einem gegebenen Computer auf der Grundlage der Hardwarekonfiguration automatisch erzeugt. Sie enthält keine persönlichen Informationen oder Informationen über die Software oder Daten, die auf Ihrem Computer gespeichert sind.

S

Scanmodus ist ein Scanparameter, der angibt, ob ein Bild schwarzweiß, in Graustufen oder farbig gescannt wird.

Scanner ist ein Gerät zum Einlesen von Bildern in einen Computer.

Schrifteffekte sind die Formatierungen einer Schriftart: fett, kursiv, unterstrichen, durchgestrichen, tiefgestellt, hochgestellt, Kapitälchen usw.

Seitenlayout ist die Anordnung von Text, Tabellen, Bildern, Absätzen und Spalten auf einer Seite. Die Schriftarten, Schriftgrößen, Schriftfarben sowie Texthintergrund und Textausrichtung sind ebenfalls Bestandteil des Seitenlayouts.

Seriennummer ist eine eindeutige Nummer, die Sie beim Kauf eines Programms erhalten. Sie wird während der Aktivierung benötigt.

Strichcodebereich ist ein Bildbereich, der einen Strichcode enthält.

Support-ID ist ein eindeutiger Identifikator einer Seriennummer mit Informationen zur Lizenz und dem Computer, auf dem diese genutzt wird. Eine Support-ID bietet zusätzlichen Schutz und wird vom technischen Support-Team geprüft, bevor technischer Support gewährt wird.

Zurück zum Anfang

T

Tabellenbereich ist ein Bildbereich, der Daten im Tabellenformat enthält. Beim Einlesen dieses Bereichstyps zeichnet das Programm innerhalb des Bereichs automatisch vertikale und horizontale Trennlinien, die eine Tabelle bilden. Im Ausgabetext wird der Bereich dann wieder als Tabelle dargestellt.

Tagged PDF ist ein PDF-Dokument, das Informationen zur Dokumentstruktur – logische Bestandteile, Abbildungen, Tabellen – enthält. Diese Informationen eines Dokuments sind als PDF-Tags kodiert. PDF-Dateien, die solche Tags enthalten, können an unterschiedliche Bildschirmgrößen angepasst und problemlos auf Handheld-Geräten angezeigt werden.

Tastenkombinationen sind Tasten oder Kombinationen von Tasten, die bei Betätigung eine bestimmte Aktion auslösen. Der Einsatz von Tastenkombinationen kann Ihre Produktivität signifikant erhöhen.

Textbereich ist ein Bildbereich, der Text enthält. Textbereiche sollten nur einspaltigen Text enthalten.

Training ist der Vorgang der Zuordnung von Zeichenbildern zu den tatsächlichen Zeichen. Siehe auch: Wenn Ihr gedrucktes Dokument nicht dem Standard entsprechende Schriftarten enthält.

Treiber ist ein Software-Programm, das ein Peripheriegerät steuert (z. B. Scanner, Bildschirm usw.).

Trennzeichen sind Symbole, die zur Trennung von Wörtern verwendet werden können (z. B. " /"," \\", " -") und selbst durch Leerzeichen vom Wort getrennt sind.

U

Unicode ist ein internationaler Textkodierungsstandard, der vom Unicode Consortium (Unicode, Inc.) entwickelt wurde. Der Unicode-Standard stellt ein einfach erweiterbares 16-Bit-System für die Kodierung von Symbolen so gut wie aller modernen Sprachen zur Verfügung. Er legt fest, wie die Symbole kodiert werden sollen und bestimmt, welche Algorithmen und Zeicheneigenschaften während des Kodierungsprozesses verwendet werden sollten.

Unzulässige Zeichen sind Zeichen, von denen Sie annehmen, dass sie in einem zu erkennenden Text nie auftreten werden. Durch die Angabe von unzulässigen Zeichen lassen sich die Geschwindigkeit und Genauigkeit des OCR-Vorgangs erhöhen.

Unzuverlässig erkannte Wörter sind Wörter, die ein oder mehrere unzuverlässig erkannte(s) Zeichen enthalten.

Unzuverlässig erkannte Zeichen sind Zeichen, die vom Programm eventuell nicht korrekt erkannt wurden.

Z

Zusammengesetztes Wort ist ein Wort, das aus zwei oder mehr Wörtern besteht. In ABBYY FineReader ist ein zusammengesetztes Wort ein Wort, dass das Programm nicht in seinem Wörterbuch finden, es aber aus zwei oder mehr Wörtern des Wörterbuchs zusammensetzen kann.

Zurück zum Anfang

02.11.2018 16:19:16


Please leave your feedback about this article