Słowniczek

A

ABBYY Hot Folder to funkcja planowania, która umożliwia wybranie folderu zawierającego obrazy i ustawienie czasu przetwarzania obrazów z tego folderu. Program ABBYY FineReader automatycznie przetwarza obrazy znajdujące się w wybranym folderze.

ABBYY Screenshot Reader to aplikacja umożliwiająca tworzenie zrzutów ekranu i rozpoznawanie zawartego w nich tekstu.

ADRT (Adaptive Document Recognition Technology) to technologia polepszająca jakość konwersji wielostronicowych dokumentów. Umożliwia na przykład rozpoznawanie takich elementów jak tytuły, nagłówki i stopki, przypisy, numery stron oraz sygnatury.

Aktywacja polega na uzyskaniu specjalnego kodu od firmy ABBYY, który umożliwia użytkownikowi korzystanie ze wszystkich funkcji programu na danym komputerze.

Aktywny obszar to aktualnie zaznaczony obszar obrazu, który można usunąć, przenieść lub zmienić. Aby uaktywnić obszar, kliknij go. Ramka obejmująca aktywny obszar jest pogrubiona i zawiera małe uchwyty, które można przeciągać w celu zmiany rozmiaru obszaru.

Analiza dokumentu to proces identyfikacji logicznej struktury dokumentu i obszarów zawierających różne typy danych. Analiza dokumentu może być przeprowadzana automatycznie bądź ręcznie.

APD (automatyczny podajnik dokumentów) to urządzenie, które automatycznie podaje dokumenty do skanera. Skaner wyposażony w podajnik automatyczny (APD) może skanować wiele stron bez interwencji użytkownika. Program ABBYY FineReader obsługuje skanowanie wielostronicowych dokumentów.

C

Czcionka o stałej szerokości to czcionka (np. Courier New), w której każdy znak zajmuje tyle samo miejsca. Aby uzyskać jak najlepsze wyniki rozpoznawania tekstów wydrukowanych takimi czcionkami, na karcie OCR okna dialogowego Opcje zaznacz opcję Maszyna do pisania w grupie opcji Typ dokumentu.

D

Douczanie to proces ustalania relacji między obrazem znaku a samym znakiem. Zobacz również: Jeśli drukowany dokument zawiera niestandardowe czcionki.

dpi (dots per inch)— jednostka rozdzielczości obrazu.

E

Efekty czcionek to wygląd czcionki (pogrubienie, kursywa, podkreślenie, przekreślenie, indeks dolny, indeks górny, kapitaliki itd.).

Powrót do góry

F

Forma podstawowa to „słownikowa” forma słowa (hasła w słowniku są zwykle podawane w formie podstawowej).

H

Hasło dostępu to ustalone przez autora hasło, którego wpisanie jest wymagane, aby można było drukować i edytować dokumenty PDF. W przypadku, gdy wybrane są niektóre ustawienia zabezpieczeń dla dokumentu, użytkownicy nie będą mogli zmieniać jego ustawień, o ile nie wprowadzą hasła określonego przez autora.

Hasło otwarcia dokumentu to zdefiniowane przez autora hasło, uniemożliwiające otwarcie dokumentu PDF użytkownikom, którzy nie znają tego hasła.

I

Identyfikator pomocy to unikalny identyfikator numeru seryjnego zawierający informacje o licencji i komputerze, na którym jest używana. Identyfikator pomocy stanowi dodatkową ochronę i jest sprawdzany przez pracowników pomocy technicznej przed udzieleniem pomocy klientowi.

Identyfikator produktu to parametr tworzony automatycznie na podstawie konfiguracji sprzętowej komputera podczas aktywacji programu ABBYY FineReader. Nie zawiera żadnych danych osobowych ani dotyczących oprogramowania ani danych przechowywanych w komputerze.

Ignorowane znaki to wszystkie znaki inne niż litery, które mogą występować w słowach (np. znaki sylab albo akcentowe) Znaki te są ignorowane przed moduł sprawdzania pisowni.

J

Jasność to parametr określający ilość bieli w obrazie. Zwiększanie jasności powoduje, że obraz jest bardziej „biały”. Wybór odpowiedniej jasności podnosi jakość rozpoznawania. Zobacz również: Wskazówki na temat skanowania.

L

Ligatura to kombinacja dwóch lub więcej znaków, które są „zlepione” (np. fi, fl, ffi). Rozróżnianie takich znaków jest szczególnie trudne dla programu ABBYY FineReader. Uznanie ich za jeden znak zwiększa dokładność rozpoznawania OCR.

M

Menedżer licencji to narzędzie do zarządzania licencjami ABBYY FineReader i aktywowania programu ABBYY FineReader PDF 15 Corporate.

Menu skrótów to menu, które wyświetla się w wyniku kliknięcia jakiegoś elementu prawym przyciskiem myszy, np. obszaru lub jakiejś części dokumentu.

Powrót do góry

N

Nagłówki i stopki to tekst lub obrazy znajdujące się na górnym lub dolnym marginesie strony. Nagłówki znajdują się na górze stron, a stopki na dole.

Numer seryjny to niepowtarzalny numer, który użytkownik otrzymuje przy zakupie programu. Służy on do aktywacji programu.

O

Obszar kodu kreskowego to obszar obrazu zawierający kod kreskowy.

Obszar obrazu to obszar obrazu zawierający grafikę. Obszar tego typu może faktycznie zawierać grafikę lub inny obiekt, który powinien być wyświetlany jako grafika (np. fragment tekstu).

Obszar obrazu w tle to obszar obrazu zawierający obraz z nadrukowanym tekstem.

Obszar rozpoznawania to obszar obrazu, który program ABBYY FineReader ma przeanalizować automatycznie.

Obszar tabeli to obszar obrazu zawierający dane w formie tabelarycznej. Kiedy program rozpoznaje obszar takiego typu, w celu określenia struktury tabeli rysuje pionowe i poziome separatory. Następnie obszar ten jest reprezentowany w pliku wynikowym w formie tabeli.

Obszar tekstowy to obszar obrazu zawierający tekst. Obszary tekstowe mogą zawierać tylko tekst w jednej kolumnie.

Obszar to część obrazu objęta przez ramkę i zawierająca określony rodzaj danych. Przed przeprowadzeniem rozpoznawania OCR program ABBYY FineReader wykrywa obszary tekstu, obrazów, tabel oraz kodów kreskowych w celu określenia, które sekcje obrazu i w jakiej kolejności mają być rozpoznane.

OCR (optyczne rozpoznawanie znaków) to technologia umożliwiająca komputerom czytanie tekstu oraz wykrywanie obrazów, tabel i innych elementów formatowania.

Odmiana to zestaw wszystkich form gramatycznych słowa.

Odwrócony obraz to obraz zawierający białe znaki na ciemnym tle.

Opcje projektu OCR to zestaw opcji, które można zdefiniować w oknie dialogowym Opcje (kliknij Narzędzia > Opcje... aby otworzyć to okno dialogowe). Do opcji tych zaliczają się także ustawienia języka i wzorce użytkownika. Opcje projektu OCR można zapisać, aby wykorzystać je w innych projektach OCR.

Opcjonalne przeniesienie to łącznik (¬)  wskazujący miejsce, w którym należy podzielić słowo lub kombinację słów, jeśli znajdują się na końcu wiersza (np. słowo „autoformatowanie” powinno zostać podzielone na części „auto” i „formatowanie”). Program ABBYY FineReader zamienia wszystkie łączniki znalezione w słowach zawartych w słowniku na znaki opcjonalnego łącznika.

Powrót do góry

P

PDF (Portable Document Format) to wszechstronny format dokumentów. Dzięki zawartości szczegółowych definicji tekstu, czcionek i grafik, plik PDF wygląda tak samo na każdym komputerze.

PDF ze znacznikami to dokument PDF zawierający informacje o strukturze dokumentu, takie jak elementy logiczne, grafika i tabele itp. Struktura ta jest kodowana za pomocą znaczników PDF. Plik PDF ze znacznikami może być dopasowany do różnych rozmiarów ekranu i jest dobrze wyświetlany na urządzeniach przenośnych.

Projekt OCR to projekt utworzony przez program ABBYY FineReader w celu przetworzenia dokumentu. Zawiera obrazy stron dokumentu, ich rozpoznany tekst (jeśli istnieje) oraz ustawienia programu.

R

Rozdzielczość to parametr skanowania mierzony w punktach na cal (dpi). Rozdzielczość 300 dpi jest zalecana w przypadku tekstu o wielkości pisma 10 punktów lub większej, 400–600 dpi jest zalecana w przypadku tekstu o mniejszej wielkości pisma (do 9 punktów).

S

Separatory to znaki oddzielające słowa (np. /, \, myślnik), które są oddzielane od słów spacjami.

Skaner to urządzenie do wprowadzania obrazów do komputera.

Skrót toskrócona forma słowa lub wyrażenia (np. MS-DOS to skrót od Microsoft Disk Operating System, a ONZ od Organizacja Narodów Zjednoczonych itd.).

Skróty klawiszowe to klawisze lub kombinacje klawiszy, których naciśnięcie powoduje wykonanie przez program określonych czynności. Dzięki nim można o wiele szybciej pracować.

Słowa niepewne to słowa zawierające przynajmniej jeden niepewny znak.

Słowo złożone to słowo składające się z przynajmniej dwóch pojedynczych słów. W programie ABBYY FineReader słowo złożone to słowo, którego nie ma w słowniku programu, ale może zostać utworzone z połączenia dwóch lub więcej innych słów ze słownika.

Sterownik to program sterujący działaniem urządzenia peryferyjnego (np. skanera, monitora itp.).

Strona kodowa to tabela wiążącą znaki z odpowiadającymi im kodami. Użytkownik może używać znaków dostępnych w określonej stronie kodowej.

System Omnifont to system rozpoznawania umożliwiający rozpoznawanie znaków dowolnych czcionek bez wcześniejszego douczania.

Szablon obszaru to szablon zawierający informacje na temat rozmiaru i lokalizacji obszarów w podobnych dokumentach.

Powrót do góry

T

Tryb kolorów określa, czy kolory dokumentu mają zostać zachowane. Z czarno-białych obrazów powstają mniejsze projekty OCR, które są szybciej przetwarzane.

Tryb skanowania to parametr skanowania określający, czy obraz ma być zeskanowany jako czarno-biały, w odcieniach szarości, czy w pełnym kolorze.

Typ dokumentu to parametr określający, w jaki sposób został wydrukowany/napisany oryginalny tekst (np. przy użyciu drukarki laserowej, maszyny do pisania itd.). W przypadku tekstów wydrukowanych za pomocą drukarki laserowej należy wybrać opcję Auto, w przypadku tekstów napisanych na maszynie do pisania należy wybrać opcję Maszyna do pisania, a w przypadku faksów należy wybrać opcję Faks.

U

Układ strony to sposób rozmieszczenia tekstu, tabel, obrazów, akapitów i kolumn na stronie. Zaliczają się do niego także czcionki, rozmiary czcionek, kolory czcionek, tło tekstu oraz orientacja tekstu.

Unicode to międzynarodowy standard kodowania tekstu opracowany przez Unicode Consortium (Unicode, Inc.). Standard Unicode opisuje łatwy do rozszerzania 16-bitowy system kodowania znaków prawie wszystkich współczesnych języków. Określa sposób kodowania tych znaków i wyznacza, które algorytmy i właściwości znaków powinny być używane podczas procesu kodowania.

Ustawienia zabezpieczeń PDF to ograniczenia, które nie pozwalają na otwieranie dokumentów PDF lub ich edycję, kopiowanie i drukowanie. Ustawienia te obejmują hasła otwarcia dokumentów, hasła dostępu oraz poziomy szyfrowania.

W

Wzorzec to zbiór powiązań uśrednionych obrazów znaków z ich nazwami. Wzorce są tworzone podczas douczania programu ABBYY FineReader na podstawie określonego tekstu.

Z

Zadanie automatyczne: Komponent zarządzania zadaniami programu ABBYY FineReader PDF 15, który umożliwia tworzenie, konfigurowanie i uruchamianie zadań programu ABBYY FineReader.

Zadanie programu ABBYY FineReader to szereg czynności, które program musi wykonać w celu przetworzenia dokumentu. ABBYY FineReader PDF 15 zawiera wiele wbudowanych zadań do wykonywania najczęstszych operacji na dokumentach. Użytkownik może też tworzyć własne zadania. Wbudowane zadania można uruchamiać w oknie Nowe zadanie.

Znaki niepewne to znaki, które mogły zostać rozpoznane przez program nieprawidłowo.

Znaki zakazane to znaki, które zdaniem użytkownika nigdy nie pojawią się w tekście do rozpoznania. Określenie zabronionych znaków zwiększa szybkość i jakość rozpoznawania OCR.

Powrót do góry

04.03.2022 7:13:23

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.