Bảng chú giải thuật ngữ

A B C D Đ G H I K L M P T U V

A

ABBYY Business Card Reader là ứng dụng thuận tiện cho phép người dùng quét danh thiếp, chụp dữ liệu danh bạ và kết xuất danh bạ đã chụp thành các định dạng điện tử khác nhau. Ứng dụng cũng có thể xử lý ảnh quét và ảnh của danh thiếp được lưu trữ trong máy tính của người dùng.

ABBYY Hot Folder là tác nhân lập lịch cho phép người dùng chọn thư mục có hình ảnh và chỉ định thời gian để xử lý hình ảnh trong thư mục này. ABBYY FineReader sẽ tự động xử lý hình ảnh từ thư mục đã chọn.

ABBYY Screenshot Reader là ứng dụng cho phép người dùng tạo ảnh chụp màn hình và nhận dạng văn bản trên ảnh chụp màn hình.

B

Bảng mã là bảng thiết lập sự tương ứng giữa các ký tự và mã của chúng. Người dùng có thể chọn các ký tự họ cần từ những ký tự có sẵn trong bảng mã.

Bố cục trang là sự sắp xếp văn bản, bảng, ảnh, đoạn và cột trên trang. Phông chữ, cỡ phông, màu phông chữ, nền văn bản và hướng văn bản cũng là một phần của bố cục trang.

C

Cài đặt bảo mật PDF là các giới hạn ngăn tài liệu PDF được mở, chỉnh sửa, sao chép hoặc in. Những cài đặt này bao gồm Mật khẩu mở tài liệu, Mật khẩu thiết lập quyền và mức mã hóa.

Chế độ màu xác định liệu màu của tài liệu có được giữ lại hay không. Hình ảnh đen trắng tạo ra tài liệu ABBYY FineReader nhỏ hơn và xử lý nhanh hơn.

Chế độ quét là tham số quét xác định hình ảnh phải được quét đen trắng, thang độ xám hay màu.

Chữ dính là tổ hợp của hai hoặc nhiều ký tự "dính vào nhau" (ví dụ: fi, fl, ffi). Những ký tự này làm cho ABBYY FineReader khó tách riêng. Coi chúng là một ký tự sẽ cải thiện độ chính xác của OCR.

Công nghệ nhận dạng ADRT® (Adaptive Document Recognition Technology) là công nghệ làm tăng chất lượng chuyển đổi tài liệu nhiều trang. Ví dụ: nó có thể nhận dạng các thành phần như tiêu đề, đầu trang và chân trang, ghi chú cuối trang, đánh số trang và chữ ký.

Quay lại đầu trang

D

Dạng thức chính là dạng thức trong "từ điển" của từ (mục từ của các mục nhập từ điển thường được đưa ra trong dạng thức chính của chúng).

Dấu phân cách là các ký hiệu có thể phân tách từ (ví dụ: /, \, gạch ngang) và được phân tách bằng dấu cách với bản thân từ.

Đ

Điểm trên một inch (dpi) là đơn vị đo độ phân giải ảnh.

Độ phân giải là tham số quét được đo bằng điểm trên một inch (dpi). Nên sử dụng độ phân giải 300 dpi cho văn bản được đặt trong phông chữ 10 pt và lớn hơn, 400 đến 600 dpi là phù hợp với văn bản có cỡ phông nhỏ hơn (9 pt trở xuống).

Độ sáng là thông số hình ảnh phản ánh mức độ màu trắng trong một bức ảnh. Tăng độ sáng làm cho bức ảnh "trắng hơn". Thiết lập giá trị độ sáng phù hợp sẽ làm tăng chất lượng nhận dạng ảnh. Để biết thêm chi tiết, xem "Quét văn bản giấy".

G

Gạch nối tùy chọn là gạch nối (¬) cho biết chính xác vị trí từ hoặc tổ hợp từ phải được tách nếu nó xuất hiện ở cuối dòng (ví dụ: "autoformat" phải được tách thành "auto–format"). ABBYY FineReader thay thế tất cả các gạch nối tìm được trong các từ trong từ điển bằng gạch nối tùy chọn.

H

Hệ biến hóa là bộ tất cả các dạng ngữ pháp của từ.

Hệ thống Omnifont (đủ mọi phông) là hệ thống nhận dạng có khả năng nhận dạng các ký tự được đặt trong bất kỳ phông chữ nào mà không cần lập mẫu trước.

Hiệu ứng phông chữ là hình thức của phông chữ (ví dụ: in đậm, in nghiêng, gạch chân, gạch ngang, ký tự dưới chân, ký tự trên đầu, chữ hoa nhỏ).

Hình ảnh đảo ngược là hình ảnh có ký tự trắng in trên nền tối.

I

ID hỗ trợ là mã nhận dạng số sêri duy nhất chứa thông tin về giấy phép và máy tính mà giấy phép đó được sử dụng. ID hỗ trợ cung cấp bảo vệ thêm và được nhân viên hỗ trợ kỹ thuật kiểm tra trước khi cung cấp hỗ trợ kỹ thuật.

ID sản phẩm được tạo tự động trên cơ sở cấu hình phần cứng khi kích hoạt ABBYY FineReader trên một máy tính nhất định.

Quay lại đầu trang

K

Khay nạp tài liệu tự động (ADF) là thiết bị tự động nạp tài liệu vào máy quét. Máy quét có ADF có thể quét nhiều trang mà không cần can thiệp thủ công. ABBYY FineReader có thể làm việc với tài liệu nhiều trang.

Ký tự bị bỏ qua là mọi ký tự không phải chữ cái được tìm thấy trong từ (ví dụ: ký tự âm tiết hoặc dấu trọng âm). Những ký tự này bị bỏ qua trong khi kiểm tra chính tả.

Ký tự bị cấm là các ký tự mà bạn cho rằng sẽ không bao giờ xuất hiện trong văn bản được nhận dạng. Chỉ định các ký tự bị cấm làm tăng tốc độ và chất lượng OCR.

Ký tự có độ tin cậy thấp là các ký tự có thể được chương trình nhận dạng không chính xác.

L

Lập mẫu là quy trình thiết lập sự tương ứng giữa hình ảnh ký tự và bản thân ký tự đó. (Xem "Nhận dạng và lập mẫu" để biết chi tiết.)

Loại tài liệu là tham số cho chương trình biết cách văn bản gốc được in (ví dụ: trên máy in laze, trên máy đánh chữ, v.v..). Đối với văn bản được in bằng laze, chọn Tự động; đối với văn bản được đánh máy, chọn Máy đánh chữ; đối với fax, chọn Fax.

M

Mã kích hoạt là mã do ABBYY phát hành cho mỗi người dùng ABBYY FineReader 12 trong quá trình kích hoạt. Mã kích hoạt được sử dụng để kích hoạt ABBYY FineReader trên máy tính đã tạo ID sản phẩm.

Mật khẩu mở tài liệu là mật khẩu ngăn người dùng mở tài liệu PDF trừ khi họ nhập mật khẩu do tác giả chỉ định.

Mật khẩu thiết lập quyền là mật khẩu ngăn người dùng khác in và chỉnh sửa tài liệu PDF trừ khi họ nhập mật khẩu do tác giả chỉ định. Nếu các cài đặt bảo mật nhất định được chỉ định cho tài liệu PDF, người dùng khác sẽ không thể thay đổi những cài đặt này cho đến khi họ nhập Mật khẩu thiết lập quyền.

Mẫu là một nhóm kết hợp giữa hình ảnh ký tự trung bình và tên tương ứng của chúng. Mẫu được tạo khi bạn lập mẫu cho ABBYY FineReader về một văn bản cụ thể.

Mẫu vùng là mẫu chứa thông tin về kích cỡ và vị trí của vùng trong các tài liệu tương tự nhau.

Máy quét là thiết bị nhập hình ảnh vào máy tính.

Quay lại đầu trang

P

PDF được gắn thẻ là tài liệu PDF chứa thông tin về cấu trúc tài liệu, như các phần lôgic, ảnh và bảng. Cấu trúc của tài liệu được mã hóa bằng thẻ PDF. Tệp PDF có những thẻ này có thể được sắp xếp lại để chỉnh cho vừa với các kích thước màn hình khác nhau và sẽ hiển thị tốt trên các thiết bị cầm tay.

Phân tích tài liệu là quá trình nhận dạng cấu trúc lôgic của tài liệu và các vùng có các loại dữ liệu khác nhau. Phân tích tài liệu có thể được thực hiện tự động hoặc thủ công.

Phông chữ cách đơn là phông chữ (chẳng hạn như Courier New) trong đó tất cả các ký tự được cách đều nhau. Để có kết quả OCR tốt hơn trên phông chữ cách đơn, chọn Công cụ>Tùy chọn..., nhấp vào tab Tài liệu và chọn Máy đánh chữ trong Loại tài liệu.

T

Tác vụ tự động hóa là một nhóm các bước xử lý tài liệu. ABBYY FineReader 12 bao gồm một số tác vụ tự động hóa được cấu hình trước, có thể truy cập từ cửa sổ Tác vụ. Người dùng cũng có thể tạo tác vụ tự động hóa của riêng họ.

Tài liệu ABBYY FineReader là đối tượng được ABBYY FineReader tạo để xử lý tài liệu giấy. Nó chứa hình ảnh các trang tài liệu, văn bản được nhận dạng (nếu có) và cài đặt chương trình của tài liệu.

Trình điều khiển là chương trình phần mềm điều khiển thiết bị ngoại vi của máy tính (ví dụ: máy quét, màn hình, v.v..).

Trình quản lý giấy phép là tiện ích được sử dụng để quản lý giấy phép ABBYY FineReader và kích hoạt ABBYY FineReader 12 Corporate.

Trình quản lý tác vụ là tính năng của ABBYY FineReader cho phép người dùng chạy tác vụ tự động hóa, tạo và sửa đổi tác vụ tự động hóa và xóa các tác vụ tự động hóa tùy chỉnh.

Từ có độ tin cậy thấp là các từ có chứa một hoặc nhiều ký tự có độ tin cậy thấp.

Từ ghép là từ được tạo thành từ hai hay nhiều từ có sẵn. Trong ABBYY FineReader, từ ghép là từ mà chương trình không tìm thấy trong từ điển nhưng có thể tạo từ hai hoặc nhiều từ trong từ điển.

Từ viết tắt là dạng rút gọn của từ hoặc cụm từ (ví dụ: MS-DOS cho Hệ điều hành Microsoft Disk Operating System, UN cho Liên hiệp Quốc, v.v..).

Tùy chọn tài liệu là nhóm các tùy chọn có thể được chọn trong hộp thoại Tùy chọn (Công cụ>Tùy chọn). Các tùy chọn tài liệu cũng bao gồm ngôn ngữ và mẫu người dùng. Các tùy chọn tài liệu có thể được lưu và sau đó được sử dụng trong các tài liệu ABBYY FineReader khác.

U

Unicode là chuẩn do Tập đoàn Unicode (Unicode, Inc.) phát triển và là hệ thống mã hóa quốc tế 16 bit để xử lý văn bản.

Quay lại đầu trang

V

Vùng là phần hình ảnh có khung bao quanh và chứa loại dữ liệu nhất định. Trước khi thực hiện OCR, ABBYY FineReader dò các vùng văn bản, ảnh, bảng và mã vạch để xác định phần nào của hình ảnh sẽ được nhận dạng và theo thứ tự nào.

Vùng ảnh là vùng hình ảnh chứa ảnh. Loại vùng này có thể bao quanh một ảnh thực hoặc bất kỳ đối tượng nào khác (ví dụ: một đoạn văn bản) phải được hiển thị dưới dạng ảnh.

Vùng ảnh nền là vùng hình ảnh chứa ảnh có văn bản in trên ảnh.

Vùng bảng là vùng hình ảnh chứa dữ liệu trong dạng bảng. Khi chương trình đọc loại vùng này, nó vẽ các dấu phân cách ngang và dọc bên trong vùng để tạo thành bảng. Vùng này sau đó được đưa ra dưới dạng bảng trong văn bản xuất ra.

Vùng hoạt động là vùng hiện được chọn trên hình ảnh có thể bị xóa, bị di chuyển hoặc sửa đổi. Để tạo một vùng hoạt động, nhấp vào vùng đó. Khung bao quanh một vùng hoạt động được in đậm và có các hình vuông nhỏ có thể kéo được để thay đổi kích cỡ của vùng.

Vùng mã vạch là vùng hình ảnh chứa mã vạch.

Vùng nhận dạng là vùng hình ảnh mà ABBYY FineReader sẽ phân tích tự động.

Vùng văn bản là vùng hình ảnh chứa văn bản. Vùng văn bản sẽ chỉ chứa văn bản có một cột.

Quay lại đầu trang

14.01.2020 17:26:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.