Glossar

A B C D E F H I K L M O Ö P S T U Z

A

ABBYY Business Card Reader ist eine praktische Anwendung, mit der Benutzer Visitenkarten scannen, die Kontaktdaten erfassen und die erfassten Kontakte in verschiedene elektronische Formate exportieren können. Darüber hinaus kann die Anwendung Scans und Fotos von Visitenkarten verarbeiten, die auf den Computern von Benutzern gespeichert sind.

ABBYY FineReader-Dokument ist ein mit ABBYY FineReader erstelltes Objekt für die Verarbeitung eines Papierdokuments. Es enthält die Bilder der Dokumentseiten, deren erkannten Text (falls vorhanden) und die Programmeinstellungen.

ABBYY Hot Folder ist ein Planungs-Agent, mit dem Sie einen Ordner mit Bildern und den Verarbeitungszeitpunkt für diese gespeicherten Bilder festlegen können. ABBYY FineReader wird die Bilder aus dem ausgewählten Ordner automatisch verarbeiten.

ABBYY Screenshot Reader ist eine Anwendung, mit der Sie Screenshots erstellen und die darin enthaltenen Texte erkennen können..

Abkürzung ist die Kurzform eines Wortes oder Ausdrucks (z. B. MS-DOS für Microsoft Disk Operating System, UN für United Nations etc.).

ADRT (Adaptive Document Recognition Technology) ist eine Technologie zur Erhöhung der Konvertierungsqualität bei mehrseitigen Dokumenten. Sie kann z. B. strukturelle Elemente erkennen, wie z. B. Überschriften, Kopf- und Fußzeilen, Fußnoten, Seitennummerierung und Signaturen.

Aktiver Bereich ist ein Bereich, der auf einem Bild aktuell markiert wurde und nun gelöscht, verschoben oder bearbeitet werden kann. Um einen Bereich zu aktivieren, klicken Sie darauf. Der Rahmen des aktiven Bereichs ist fett formatiert und enthält kleine Quadrate, die zur Änderung der Größe des Bereichs an eine andere Position gezogen werden können.

Aktivierung ist der Vorgang, bei dem ein bestimmter Code von ABBYY abgerufen wird, der es dem Benutzer ermöglicht, seine Version des Produkts auf dem gegebenen Computer im vollen Umfang zu nutzen.

Aktivierungscode ist ein Code, den ABBYY jedem Benutzer von ABBYY FineReader 12 während der Aktivierung ausstellt. Der Aktivierungscode wird benötigt, um ABBYY FineReader auf dem Computer zu aktivieren, der die Produkt-ID generiert hat.

Allschriftlesesystem ist ein Erkennungssystem, das Zeichen in jeder Schriftart ohne vorheriges Testen erkennt.

Auflösung ist ein Scanparameter, gemessen in Dots per Inch (dpi). Texte mit einer Schriftgröße ab 10 pt  sollten mit einer Auflösung von 300 dpi, kleinere Schriftgrößen (9 pt und kleiner) mit einer Auflösung von 400-600 dpi gescannt werden.

Automatic Document Feeder (ADF) ist ein Gerät, dass Dokumente automatisch einem Scanner zuführt. Scanner mit ADF können ohne manuellen Eingriff mehrere Seiten verarbeiten. ABBYY FineReader unterstützt mehrseitige Dokumente.

Automatisierter Task ist eine Reihe von Schritten zur Verarbeitung von Dokumenten. ABBYY FineReader 12 beinhaltet eine Reihe vorkonfigurierter, automatisierter Tasks, auf die über das Fenster Tasks zugegriffen werden kann. Sie können aber auch Ihre eigenen automatisierten Tasks erstellen.

Zurück zum Anfang

B

Berechtigungskennwort ist ein Kennwort, das andere Benutzer daran hindert, das PDF-Dokument zu drucken oder zu bearbeiten, es sei denn, sie geben das vom Autor festgelegte Kennwort ein. Wenn bestimmte Sicherheitseinstellungen für ein PDF-Dokument festgelegt wurden, können diese von anderen Benutzern nur nach Eingabe des Berechtigungskennworts geändert werden.

Bereich ist ein Bildbereich, der von einem Rahmen umgeben ist und einen bestimmten Datentyp enthält. Vor dem OCR-Vorgang unterteilt ABBYY FineReader das Dokument in Text-, Bild-, Tabellen- und Strichcodebereiche, um festzulegen, welche Teile des Abbildes in welcher Reihenfolge erkannt werden sollen.

Bereichsvorlage ist eine Vorlage, die Informationen über Größe und Positionen der Bereiche in ähnlich aussehenden Dokumente enthält.

Bildbereich ist ein Bildbereich, der ein Bild enthält. Dieser Bereichstyp kann richtige Bilder oder andere als Bild darzustellende Objekte enthalten (z. B. Textabschnitte).

C

Codeseite ist eine Tabelle, die Zuordnungen zwischen Zeichen und deren Codes herstellt. Die benötigten Zeichen können von den Benutzern aus dem Zeichensatz der Codeseite ausgewählt werden.

D

Dokumentanalyse ist ein Prozess der Identifizierung der logischen Struktur eines Dokuments und von Bereichen, die verschiedene Datentypen enthalten. Dokumentanalysen können automatisch oder manuell durchgeführt werden.

Dokumententyp ist ein Parameter, der dem Programm mitteilt, wie der Originaltext gedruckt wurde (z. B. mit einem Laserdrucker, mit einer Schreibmaschine etc.). Für mit Laserdruckern gedruckte Texte wählen Sie Auto; für Schreibmaschinentexte wählen Sie Schreibmaschine; für Faxe wählen Sie Fax.

Dokumentoptionen ist die Gruppe von Optionen, die im Dialogfeld Optionen definiert werden können (Extras > Optionen). Zu den Dokumentoptionen gehören auch benutzerdefinierte Sprachen und Muster. Dokumentoptionen können gespeichert und dann für andere ABBYY FineReader-Dokumente geladen und wiederverwendet werden.

Dots per Inch (dpi) ist eine Maßeinheit der Bildauflösung.

E

Erkennungsbereich ist ein Bildbereich, den ABBYY FineReader automatisch analysieren soll.

Zurück zum Anfang

F

Im Farbmodus wird festgelegt, ob die Dokumentfarben erhalten werden sollen oder nicht. Schwarzweiß-Bilder resultieren in kleineren ABBYY FineReader-Dokumenten und können schneller verarbeitet werden.

H

Helligkeit ist ein Bildparameter, der den Weißanteil in einem Bild wiedergibt. Durch die Erhöhung der Helligkeit wird das Bild "weißer". Durch das Festlegen einer geeigneten Helligkeit wird die Erkennungsqualität verbessert. Weitere Informationen finden Sie unter "Scannen von Papierdokumenten".

Hintergrundbildbereich  ist ein Bildbereich, der ein Bild mit einem darüber gedruckten Text enthält.

I

Ignorierte Zeichen sind in Wörtern erkannte Zeichen, die keine Buchstaben sind (z. B. Silbenzeichen oder Betonungszeichen).  Diese Zeichen werden bei der Rechtschreibprüfung ignoriert.

Invertiertes Bild ist ein Bild mit hellen Zeichen vor dunklem Hintergrund.

K

Konstantschriftart ist eine Schriftart (wie Courier New) mit gleichen Zeichenabständen. Zur Verbesserung der OCR-Qualität wählen Sie bei Konstantschriftarten unter Extras > Optionen..., klicken Sie auf die Registerkarte Dokument und wählen Sie dann unter Dokumententyp die Option Schreibmaschine.

L

License Manager ist ein zur Verwaltung von ABBYY FineReader-Lizenzen und zur Aktivierung von ABBYY FineReader 12 Corporate verwendetes Hilfsprogramm.

Ligatur ist eine Kombination aus zwei oder mehr scheinbar "zusammengeklebten" Zeichen "wie" beispielsweise e.g. fi, fl, ffi. Solche Zeichen sind für ABBYY FineReader schwer zu trennen. Darum lassen sich genauere OCR-Ergebnisse erzielen, wenn diese Buchstabenkombinationen gleich als eigenständige Zusammensetzungen behandelt werden.

M

Muster ist eine Reihe von Verbindungen zwischen gemittelten Zeichenbildern und deren jeweiligen Namen. Muster werden dann erstellt, wenn Sie ABBYY FineReader anhand eines spezifischen Textes trainieren.

Zurück zum Anfang

O

Optionaler Trennstrich ist ein Trennstrich (¬), der anzeigt, wo genau ein Wort oder ein zusammengesetzter Ausdruck getrennt werden soll, wenn er am Zeilenende auftritt (z. B. muss "automatisch" "auto"-matisch" getrennt "werden"). ABBYY FineReader ersetzt alle Trennstriche in Wörtern, die im Wörterbuch enthalten sind, durch optionale Trennstriche.

Ö

Öffnungskennwort ist ein Kennwort, das andere Benutzer daran hindert, ein PDF-Dokument zu öffnen, es sei denn, sie geben das vom Autor festgelegte Kennwort ein.

P

Paradigma ist der Satz aller grammatikalischen Formen eines Worts.

PDF-Sicherheitseinstellungen sind Beschränkungen für das Öffnen, Bearbeiten, Kopieren oder Drucken von PDF-Dokumenten. Dazu gehören Kennwörter zum Öffnen oder für Zugriffsrechte sowie Verschlüsselungsstufen.

Primärform ist die "Wörterbuchform" eines Wortes (Stichwörter von Wörterbucheinträgen werden im Allgemeinen in ihrer Primärform angegeben).

Produkt-ID wird bei der Aktivierung von ABBYY FineReader auf einem gegebenen Computer auf der Grundlage der Hardwarekonfiguration automatisch erzeugt.

S

Scanmodus ist ein Scanparameter, der angibt, ob ein Bild schwarzweiß, in Graustufen oder farbig gescannt wird.

Scanner ist ein Gerät zum Einlesen von Bildern in einen Computer.

Schriftarteneffekte sind die Formatierungen einer Schriftart: fett, kursiv, unterstrichen, durchgestrichen, tiefgestellt, hochgestellt, Kapitälchen usw.

Seitenlayout ist die Anordnung von Text, Tabellen, Bildern, Absätzen und Spalten auf einer Seite. Die Schriftarten, Schriftgrößen, Schriftfarben sowie Texthintergrund und Textausrichtung sind ebenso Bestandteil des Seitenlayouts.

Strichcodebereich ist ein Bildbereich, der einen Strichcode enthält.

Support-ID ist ein eindeutiger Lizenz-Identifikator einer Seriennummer mit Informationen zur Lizenz und dem Computer, auf dem diese genutzt wird. Eine Support-ID bietet zusätzlichen Schutz und wird vom technischen Support-Team geprüft, bevor technischer Support gewährt wird.

Zurück zum Anfang

T

Tabellenbereich ist ein Bildbereich, der Daten in Tabellenform enthält. Beim Einlesen dieses Bereichstyps zeichnet das Programm innerhalb des Bereichs automatisch vertikale und horizontale Trennlinien, die eine Tabelle bilden. Im Ausgabetext wird der Bereich dann wieder als Tabelle dargestellt.

Tagged PDF ist ein PDF-Dokument, das Informationen zur Dokumentstruktur – logische Bestandteile, Bilder, Tabellen – enthält. Diese Informationen eines Dokuments sind als PDF-Tags kodiert. PDF-Dateien, die solche Tags enthalten, können an unterschiedliche Bildschirmgrößen angepasst und problemlos auf Handheld-Geräten angezeigt werden.

Task-Manager ist eine ABBYY FineReader-Funktion, mit der Sie einen automatisierten Task ausführen, erstellen und bearbeiten sowie benutzerdefinierte automatisierte Tasks löschen können.

Testen ist der Vorgang der Zuordnung von Zeichenabbildern zu den tatsächlichen Zeichen. (Detaillierte Informationen dazu finden Sie unter "Erkennung mit Test".)

Textbereich ist ein Bildbereich, der Text enthält. Beachten Sie, dass Textbereiche nur einspaltigen Text enthalten dürfen.

Treiber ist ein Software-Programm, das ein Peripheriegerät steuert (z. B. Scanner, Bildschirm usw.).

Trennzeichen sind Symbole, die zur Trennung von Wörtern verwendet werden können (z. B. " /"," \\", " -") und selbst durch Leerstellen vom Wort getrennt sind.

U

Unicode ist ein Standard, der von The Unicode Consortium (Unicode, Inc.) entwickelt wurde (Unicode, Inc.) und ist ein internationales 16-Bit- Verschlüsselungssystem zur Verarbeitung von Text.

Unzulässige Zeichen sind Zeichen, von denen Sie annehmen, dass sie in einem Text nie erkannt werden sollen. Durch die Angabe von unzulässigen Zeichen lassen sich die Geschwindigkeit und Genauigkeit des OCR-Vorgangs erhöhen.

Unzuverlässig erkannte Wörter sind Wörter, die ein oder mehrere unzuverlässig erkannte Zeichen enthalten.

Unzuverlässig erkannte Zeichen sind Zeichen, die vom Programm eventuell nicht korrekt erkannt wurden.

Z

Zusammengesetztes Wort ist ein Wort, das aus zwei oder mehr Wörtern besteht. In ABBYY FineReader ist ein zusammengesetztes Wort ein Wort, dass das Programm nicht in seinem Wörterbuch finden, es aber aus zwei oder mehr Wörtern des Wörterbuchs zusammensetzen kann.

Zurück zum Anfang

1/14/2020 5:26:18 PM


Please leave your feedback about this article