Глосарій

А Д Е З І К Л М Н О П Р С Т Ф Ш Я

ABBYY Business Card Reader — це зручна програма, яка дозволить відсканувати візитні картки, розпізнати контактну інформацію з них та експортувати отримані дані в різні електронні формати, а також обробити подібним чином цифрові фотографії або раніше отримані зображення візитних карток.

ABBYY Hot Folder — додаток-планувальник, за допомогою якого можна призначити час обробки документів із вказаної папки. Відкривання файлів і розпізнавання зображень може бути виконано в той час, коли комп’ютер найменше завантажений, наприклад, вночі.

ABBYY Screenshot Reader — додаток, що дозволяє зробити знімок вибраної зони екрана та розпізнати текст, що міститься на знімку.

ADF (Automatic Document Feeder) — пристрій автоматичної подачі паперу, що дозволяє відсканувати велику кількість документів без ручного втручання. ABBYY FineReader підтримує сканування багатосторінкових документів.

ADRT® (Adaptive Document Recognition Technology) — технологія адаптивного розпізнавання документів, яка підвищує якість конвертації багатосторінкових документів. Зокрема, вона дозволяє визначати такі елементи структури документа, як заголовки, колонтитули, виноски, нумерацію сторінок, підписи.

dpi (dots per inch) — кількість точок на дюйм; одиниця виміру роздільної здатності.

Product ID — параметр, який створюється на основі даних про конфігурацію комп’ютера в момент активації.

Support ID — унікальний ідентифікатор серійного номера, який містить інформацію про ліцензію та комп’ютер, забезпечує додатковий захист серійного номера й на підставі якого відбувається надання технічної підтримки.

Unicode — стандарт, розроблений концерном Unicode. Керує процесом кодування символів і надає шістнадцятибітну міжнародну розширювану систему кодування символів для обробки інформації більшістю мов народів світу. Стандарт Unicode визначає кодування символу, а також властивості й алгоритми, які використовуються під час реалізації цього процесу.

А

Абревіатура — скорочення, утворене з початкових літер слів. Наприклад, МГУ, MS-DOS тощо.

Активація — процес отримання користувачем у компанії ABBYY спеціального коду, необхідного для забезпечення роботи програми в повнофункціональному режимі на конкретному комп’ютері.

Активаційний код — код, який видається користувачеві після проходження процедури активації ABBYY FineReader 12. Призначений для активації продукту на тій машині, на якій було отримано Product ID.

Активна зона — виділена зона, над якою виконуються такі дії, як видалення, зміна типу тощо. Для того щоб зробити зону активною, досить клацнути на ній курсором миші. Товщина рамки такої зони — напівжирна, а на її кутах знаходяться «квадратики».

Аналіз документа — процес виділення елементів логічної структури та зон різних типів у документі. Аналіз документа може виконуватися автоматично або вручну.

На початок

Д

Документ ABBYY FineReader — це об’єкт, який створюється програмою ABBYY FineReader для роботи з одним вхідним документом з урахуванням його цілісної структури. Він містить зображення сторінок, відповідний їм розпізнаний текст (якщо є), налаштування програми (опції сканування, розпізнавання, збереження тощо).

Драйвер — програма, що керує пристроєм (наприклад, сканером, монітором тощо).

Е

Еталон — набір пар «усереднене точкове зображення символу» — його назва, який створюється в процесі навчання системи на конкретному тексті.

З

Заборонені символи — як заборонені символи для поточної мови вказуються ті, які напевне не можуть зустрічатися в текстах, що розпізнаються з підключенням цієї мови. Вказання таких символів може суттєво збільшити швидкість і надійність розпізнавання.

Завдання ABBYY FineReader — це набір послідовних кроків, кожен з яких відповідає одному етапу обробки документа. У програмі ABBYY FineReader 12 передбачені вбудовані завдання, повністю готові до використання. Також можна створювати власні завдання — завдання користувача. Запуск вбудованого завдання виконується з вікна Завдання.

Зображення — зона, яка використовується для виділення зображень. Вона може містити зображення або будь-яку іншу частину тексту, яку ви хочете передати в розпізнаний текст як зображення.

Зона — ділянка зображення, укладена в рамку. Перед розпізнаванням програма виділяє зони з текстом, зображеннями, таблицями та штрих-кодами. Зони виділяються для того, щоб вказати системі, які ділянки зображення потрібно розпізнавати та в якому порядку.

Зона розпізнавання — зона, яка використовується для розпізнавання й автоматичного аналізу частини зображення. Після натискання на кнопку Розпізнати виділена зона автоматично аналізується та розпізнається.

І

Ігноровані символи — як ігноровані символи вказуються ті, які можуть зустрічатися всередині слова, наприклад, знаки розподілу на склади чи наголосу в словниках. Під час перевірки за словником програма не враховує ці знаки. У розпізнаному тексті ці символи зберігаються, але під час перевірки орфографії не враховуються.

Інвертоване зображення — зображення, текст якого надруковано на темному тлі світлими літерами.

К

Кодова сторінка — таблиця, в якій задано відношення між кодами символів і їхніми накресленнями. У системі ABBYY FineReader кодову сторінку представлено ​​як набір символів, з якого можна вибрати потрібні символи.

Колірний режим — параметр, який показує, чи буде збережено колірне оформлення документа. Чорно-білий режим дозволяє зменшити розмір документа FineReader і пришвидшити його обробку.

На початок

Л

Лігатура — пара або трійка літер, які через особливості накреслення склеюються між собою. Наприклад, ге, го, fe, ffi, tt тощо.

М

Менеджер завдань — вбудований менеджер, який дозволяє запускати виконання завдань, створювати завдання і налаштовувати їх, а також видаляти завдання користувача, які не використовуються.

Менеджер ліцензій — додаток, у якому здійснюється керування ліцензіями та активація ABBYY FineReader 12 Corporate.

Моноширинний шрифт — будь-який шрифт, літери якого мають однакову ширину (моно). Наприклад, шрифт Courier New. Для покращення якості розпізнавання моноширинних шрифтів на закладці Документ діалогу Налаштування у пункті Тип друку встановіть перемикач у положення Друкарська машинка.

М’який перенос — перенос (¬) показує, у якому саме місці має бути розірване слово або словосполучення (наприклад, «Автоформат»), якщо воно потрапляє на кінець рядка (наприклад, «Авто-формат»). Усі переноси в словникових словах ABBYY FineReader замінює на м’який перенос.

Н

Навчання — створення пар «растрове зображення — назва символу». Докладніше див. у розділі «Розпізнавання з навчанням».

Накреслення шрифту — спосіб виділення в тексті (напівжирний, похилий, з підкресленням, перекреслений, верхній індекс, нижній індекс, малі прописні).

Налаштування документа — сукупність значень опцій, розташованих на закладках діалогу Опції (меню Сервіс>Опції...). У набір опцій також входять мови та еталони користувача. Набір опцій можна зберегти й потім використовувати (завантажувати) в інших документах ABBYY FineReader.

Невпевнено розпізнані символи — символи, які можливо були розпізнані неправильно.

Невпевнено розпізнані слова — слова, які містять невпевнено розпізнані символи.

На початок

О

Омніфонтова система — система розпізнавання, яка розпізнає символи практично будь-яких розмірів і накреслень.

Оформлення сторінки — розташування тексту, таблиць і зображень у документі, розбивка на абзаци, гарнітура і розмір шрифту, колонки, напрямок тексту, колір букв і фон тексту.

П

Парадигма — сукупність усіх граматичних форм слова.

Параметри захисту PDF — обмеження на відкривання, редагування копіювання та друк PDF-документа. У ці параметри входять пароль відкривання документа, пароль для зміни прав доступу та рівень шифрування.

Пароль відкривання документа — пароль, що присвоюється PDF-документам. Користувачі можуть відкрити PDF-документ тільки після введення пароля, заданого автором документа.

Пароль для зміни прав доступу — пароль, що присвоюється PDF-документам. Користувачі можуть роздрукувати або внести зміни у PDF-документ тільки після введення пароля, заданого автором документа. При використанні захисту PDF-документа користувачі також повинні будуть вказати цей пароль, для того щоб змінити параметри захисту PDF.

Початкова форма — форма, в якій слова подаються в словнику. Для іменників це форма називного відмінка однини; для прикметників — форма чоловічого роду однини називного відмінка; для дієслів, дієприкметників і дієприслівників — це неозначена форма (інфінітив).

На початок

Р

Режим сканування — параметр сканування; зображення може бути чорно-білим, сірим або кольоровим.

Розділювачі — символи, які можуть розділяти слова, наприклад, /, \, тире тощо і які пишуться окремо від слів.

Роздільна здатність — параметр сканування, що показує, яка кількість точок припадає на одиницю довжини. Од. 300 dpi відповідає розміру шрифту 10 і більше пунктів, 400–600 dpi для текстів, набраних дрібним шрифтом (9 і менше пунктів).

С

Сканер — пристрій, призначений для введення зображень у комп’ютер.

Складне слово — слово, утворене шляхом складання двох основ (коренів), відсутнє в словнику. Воно може складатися з наявних у словнику слів.

Т

Таблиця — зона, яка використовується для виділення таблиць або тексту, що має табличну структуру. При розпізнаванні програма розбиває цю зону на рядки і стовпчики та формує табличну структуру. У вихідному тексті ця зона передається таблицею.

Теги PDF — спеціальні теги, які використовуються для виділення логічних частин та розмітки таблиць і зображень у PDF-документі. Теги, вбудовувані у PDF-документ, забезпечують зручність перегляду документа на екранах різного розміру, наприклад, на екранах кишенькових комп’ютерів.

Текст — зона, яка використовується для виділення тексту. Вона повинна містити тільки текст в одну шпальту.

Тип друку вхідного документа — особливість у накресленні символів вхідного тексту залежно від того, яким чином він надрукований (у друкарні, на друкарській машинці тощо). Для типографського тексту варто встановлювати режим Авто, для машинописного — режим Друкарська машинка, для роздрукованого факсимільного повідомлення — режим Факс.

Ф

Фонове зображення — зона, яка використовується для виділення зображень, поверх яких знайдено текстовий блок.

Ш

Шаблон зон — у шаблоні зберігається положення і розміри зон на сторінці. Ви можете використовувати шаблони для прискорення розпізнавання документів, що мають однакову структуру (наприклад, форми, анкети).

Штрих-код — зона, яка використовується для виділення ділянок зображення, що містять штрих-код.

Я

Яскравість — параметр сканування, який визначає кількість білого кольору на вашому зображенні. Чим вищою ви ставите яскравість, тим світлішим вийде відскановане зображення. За правильного налаштування яскравості якість розпізнавання зростає. Докладніше див. "Сканування паперових документів".

На початок

1/14/2020 5:26:22 PM


Please leave your feedback about this article