Bảng chú giải thuật ngữ

A

ABBYY Hot Folder là tác nhân lập lịch cho phép người dùng chọn thư mục có hình ảnh và chỉ định thời gian để xử lý hình ảnh trong thư mục này. ABBYY FineReader sẽ tự động xử lý hình ảnh từ thư mục đã chọn.

ABBYY Screenshot Reader là ứng dụng cho phép người dùng tạo ảnh chụp màn hình và nhận dạng văn bản trên ảnh chụp màn hình.

ADF (Khay nạp tài liệu tự động) là thiết bị tự động nạp tài liệu vào máy quét. Máy quét có ADP có thể quét nhiều trang mà không cần can thiệp thủ công. ABBYY FineReader có thể làm việc với tài liệu nhiều trang.

ADRT® (Công nghệ nhận dạng tài liệu thích ứng) là công nghệ làm tăng chất lượng chuyển đổi tài liệu nhiều trang. Ví dụ: nó có thể nhận dạng các thành phần như tiêu đề, đầu trang và chân trang, ghi chú cuối trang, đánh số trang và chữ ký.

B

Bố cục trang là sự sắp xếp văn bản, bảng, ảnh, đoạn và cột trên trang. Phông chữ, cỡ phông, màu phông chữ, nền văn bản và hướng văn bản cũng là một phần của bố cục trang.

C

Các phím tắt là các phím hoặc tổ hợp phím giúp kích hoạt một thao tác cụ thể khi bấm. Sử dụng các phím tắt có thể tăng năng suất lên đáng kể.

Cài đặt bảo mật PDF là các giới hạn ngăn tài liệu PDF được mở, chỉnh sửa, sao chép hoặc in. Những cài đặt này bao gồm mật khẩu mở tài liệu, mật khẩu cấp quyền và mức mã hóa.

Chế độ màu xác định liệu màu của tài liệu có được giữ lại hay không. Hình ảnh đen trắng tạo ra dự án OCR nhỏ hơn và xử lý nhanh hơn.

Chế độ quét là tham số quét xác định hình ảnh phải được quét đen trắng, thang độ xám hay màu.

Chữ dính là tổ hợp của hai hoặc nhiều ký tự "dính vào nhau" (ví dụ: fi, fl, ffi). Những ký tự này làm cho ABBYY FineReader khó tách riêng. Coi chúng là một ký tự sẽ cải thiện độ chính xác của OCR.

Quay lại đầu trang

D

Dạng thức chính là dạng thức trong "từ điển" của từ (mục từ của các mục nhập từ điển thường được đưa ra trong dạng thức chính của chúng).

Dấu phân cách là các ký hiệu có thể phân tách từ (ví dụ: /, \, gạch ngang) và được phân tách bằng dấu cách với bản thân từ.

Đầu trang và chân trang là hình ảnh hoặc văn bản ở lề trên hoặc dưới của một trang. Đầu trang nằm ở đỉnh trang và chân trang nằm ở đáy trang.

Độ phân giải là tham số quét được đo bằng điểm trên một inch (dpi). Nên sử dụng độ phân giải 300 dpi cho văn bản được đặt trong phông chữ 10 pt và lớn hơn, 400 đến 600 dpi là phù hợp với văn bản có cỡ phông nhỏ hơn (9 pt trở xuống).

Độ sáng là thông số hình ảnh phản ánh mức độ màu trắng trong một bức ảnh. Tăng độ sáng làm hình ảnh "trắng hơn". Thiết lập giá trị độ sáng phù hợp sẽ làm tăng chất lượng nhận dạng ảnh. Xem thêm: Gợi ý quét.

dpi (điểm trên một inch) là đơn vị đo độ phân giải ảnh.

Dự án OCR là dự án được tạo bởi ABBYY FineReader để xử lý tài liệu. Nó chứa hình ảnh các trang tài liệu, văn bản được nhận dạng (nếu có) và cài đặt chương trình của tài liệu.

G

Gạch nối tùy chọn là gạch nối (¬)  cho biết chính xác vị trí từ hoặc tổ hợp từ phải được tách nếu nó xuất hiện ở cuối dòng (ví dụ: "autoformat" phải được tách thành "auto–format"). ABBYY FineReader thay thế tất cả các gạch nối tìm được trong các từ trong từ điển bằng gạch nối tùy chọn.

H

Hệ biến hóa là bộ tất cả các dạng ngữ pháp của từ.

Hệ thống Omnifont là hệ thống nhận dạng có khả năng nhận dạng các ký tự được đặt trong bất kỳ phông chữ nào mà không cần lập mẫu trước.

Hiệu ứng phông chữ là hình thức của phông chữ (ví dụ: in đậm, in nghiêng, gạch chân, gạch ngang, ký tự dưới chân, ký tự trên đầu, chữ hoa nhỏ).

Hình ảnh đảo ngược là hình ảnh có ký tự trắng in trên nền tối.

Quay lại đầu trang

I

ID hỗ trợ là mã nhận dạng số sêri duy nhất chứa thông tin về giấy phép và máy tính mà giấy phép đó được sử dụng. ID hỗ trợ cung cấp bảo vệ thêm và được nhân viên hỗ trợ kỹ thuật kiểm tra trước khi cung cấp hỗ trợ kỹ thuật.

ID sản phẩm được tạo tự động trên cơ sở cấu hình phần cứng khi kích hoạt ABBYY FineReader trên một máy tính nhất định. ID sản phẩm không chứa bất cứ thông tin cá nhân hoặc thông tin gì về phần mềm và dữ liệu được lưu trữ trên máy tính của bạn.

K

Kích hoạt là quá trình lấy mã đặc biệt từ ABBYY cho phép người dùng sử dụng bản sao sản phẩm của họ trong chế độ đầy đủ trên một máy tính nhất định.

Ký tự bị bỏ qua là mọi ký tự không phải chữ cái được tìm thấy trong từ (ví dụ: ký tự âm tiết hoặc dấu trọng âm). Những ký tự này bị bỏ qua trong khi kiểm tra chính tả.

Ký tự bị cấm là các ký tự mà bạn cho rằng sẽ không bao giờ xuất hiện trong văn bản được nhận dạng. Chỉ định các ký tự bị cấm làm tăng tốc độ và chất lượng OCR.

Ký tự có độ tin cậy thấp là các ký tự có thể được chương trình nhận dạng không chính xác.

L

Lập mẫu là quy trình thiết lập sự tương ứng giữa hình ảnh ký tự và bản thân ký tự đó. Xem thêm: Nếu tài liệu in của bạn chứa phông chữ phi tiêu chuẩn.

Loại tài liệu là tham số cho chương trình biết cách văn bản gốc được in (ví dụ: trên máy in laze, trên máy đánh chữ, v.v..). Đối với văn bản được in bằng laze, chọn Tự động, đối với văn bản được đánh máy, chọn Máy đánh chữ, đối với fax, chọn Fax.

M

Mật khẩu cấp quyền là mật khẩu ngăn người dùng khác in và chỉnh sửa tài liệu PDF trừ khi họ nhập mật khẩu do tác giả chỉ định. Nếu một số cài đặt bảo mật được chọn cho tài liệu, những người dùng khác sẽ không thể thay đổi những cài đặt này cho đến khi họ nhập mật khẩu.

Mật khẩu mở tài liệu là mật khẩu ngăn người dùng mở tài liệu PDF trừ khi họ nhập mật khẩu do tác giả chỉ định.

Mẫu là một nhóm kết hợp giữa hình ảnh ký tự trung bình và tên tương ứng của chúng. Mẫu được tạo khi bạn lập mẫu cho ABBYY FineReader về một văn bản cụ thể.

Mẫu vùng là mẫu chứa thông tin về kích cỡ và vị trí của vùng trong các tài liệu tương tự nhau.

Máy quét là thiết bị nhập hình ảnh vào máy tính.

Quay lại đầu trang

O

OCR (Nhận dạng ký tự quang học) là công nghệ cho phép máy tính đọc văn bản, phát hiện ảnh, bảng và các thành phần định dạng khác.

P

PDF (Định dạng tài liệu di động) là một định dạng tài liệu phổ biến. Một tệp PDF trông giống nhau trên mọi máy tính mà tệp được hiển thị nhờ các mô tả chi tiết cho văn bản, phông chữ và đồ họa chứa trong tệp.

PDF được gắn thẻ là tài liệu PDF chứa thông tin về cấu trúc tài liệu, như các phần lôgic, ảnh và bảng. Cấu trúc của tài liệu được mã hóa bằng thẻ PDF. Tệp PDF có những thẻ này có thể được sắp xếp lại để chỉnh cho vừa với các kích thước màn hình khác nhau và sẽ hiển thị tốt trên các thiết bị cầm tay.

Phân tích tài liệu là quá trình nhận dạng cấu trúc lôgic của tài liệu và các vùng có các loại dữ liệu khác nhau. Phân tích tài liệu có thể được thực hiện tự động hoặc thủ công.

Phông chữ cách đơn là phông chữ (chẳng hạn như Courier New) trong đó tất cả các ký tự được cách đều nhau. Để có kết quả OCR tốt hơn trên phông chữ cách đơn, chọn OCR > Tùy chọn, nhấp vào tab Máy đánh chữ trong Loại tài liệu nhóm tùy chọn.

S

Đơn lối tắt là trình đơn xuất hiện khi bạn nhấp chuột phải vào đối tượng nào đó như một vùng hoặc một phần khác của tài liệu.

Số sêri là số duy nhất mà bạn nhận được khi mua chương trình. Số này được sử dụng khi kích hoạt.

T

Tác vụ ABBYY FineReader là tập hợp các bước liên tiếp mà chương trình cần thực hiện để xử lý một tài liệu. ABBYY FineReader 14 bao gồm một số tác vụ tích hợp phục vụ cho các nhu cầu xử lý tài liệu phổ biến nhất. Người dùng cũng có thể tạo tác vụ tùy chỉnh của riêng mình. Có thể khởi chạy các tác vụ tích hợp sẵn trong cửa sổ Tác vụ Mới.

Tác vụ tự động: Một thành phần quản lý tác vụ của ABBYY FINEREADER 14 cho phép bạn tạo, thiết lập và khởi chạy các tác vụ ABBYY FineReader.

Vùng văn bản là vùng hình ảnh chứa văn bản. Vùng văn bản sẽ chỉ chứa văn bản có một cột.

Trang mã là bảng thiết lập sự tương ứng giữa các ký tự và mã của chúng. Người dùng có thể chọn các ký tự họ cần từ những ký tự có sẵn trong bảng mã.

Trình điều khiển là chương trình phần mềm điều khiển thiết bị ngoại vi của máy tính (ví dụ: máy quét, màn hình, v.v..).

Trình quản lý giấy phép là tiện ích được sử dụng để quản lý giấy phép ABBYY FineReader và kích hoạt ABBYY FineReader 14.

Từ có độ tin cậy thấp là các từ có chứa một hoặc nhiều ký tự có độ tin cậy thấp.

Từ ghép là từ được tạo thành từ hai hay nhiều từ có sẵn. In ABBYY FineReader, a từ ghép là từ mà chương trình không tìm thấy trong từ điển nhưng có thể tạo từ hai hoặc nhiều từ trong từ điển.

Từ viết tắt ilà dạng rút gọn của từ hoặc cụm từ (ví dụ: MS-DOS cho Hệ điều hành Microsoft Disk Operating System, UN cho Liên hiệp Quốc, v.v..).

Tùy chọn dự án OCR Các thiết lập các tùy chọn có thể được chọn trong Tùy chọn (nhấp Công cụ > Tùy chọn... để mở hộp thoại này). Các tùy chọn này cũng bao gồm ngôn ngữ và mẫu người dùng. Có thể lưu các tùy chọn dự án OCR rồi sử dụng trong các dự án OCR khác.

Quay lại đầu trang

U

Unicode là chuẩn mã hóa văn bản quốc tế do Tập đoàn Unicode (Unicode, Inc.) phát triển. Chuẩn Unicode cung cấp hệ thống 16 bit có thể dễ dàng mở rộng để mã hóa các ký hiệu từ hầu hết tất cả các ngôn ngữ hiện nay. Chuẩn mã hóa này quy định các ký hiệu sẽ được mã hóa như thế nào và xác định những thuật toán và thuộc tính ký tự nào sẽ được sử dụng trong quá trình mã hóa.

V

Vùng ảnh là vùng hình ảnh chứa ảnh. Loại vùng này có thể bao quanh một ảnh thực hoặc bất kỳ đối tượng nào khác (ví dụ: một đoạn văn bản) phải được hiển thị dưới dạng ảnh.

Vùng ảnh nền là vùng hình ảnh chứa ảnh có văn bản in trên ảnh.

Vùng bảng là vùng hình ảnh chứa dữ liệu trong dạng bảng. Khi chương trình đọc loại vùng này, nó vẽ các dấu phân cách ngang và dọc bên trong vùng để tạo thành bảng. Vùng này sau đó được đưa ra dưới dạng bảng trong văn bản xuất ra.

Vùng hoạt động là vùng hiện được chọn trên hình ảnh có thể bị xóa, bị di chuyển hoặc sửa đổi. Để làm một vùng hoạt động, nhấp vào vùng đó. Khung bao quanh một vùng hoạt động được in đậm và có các điểm chỉnh cỡ có thể kéo được để thay đổi kích cỡ của vùng.

Vùng là phần hình ảnh có khung bao quanh và chứa loại dữ liệu nhất định. Trước khi thực hiện OCR, ABBYY FineReader dò các vùng văn bản, ảnh, bảng và mã vạch để xác định phần nào của hình ảnh sẽ được nhận dạng và theo thứ tự nào.

Vùng mã vạch là vùng hình ảnh chứa mã vạch.

Vùng nhận dạng là vùng hình ảnh mà ABBYY FineReader sẽ phân tích tự động.

Quay lại đầu trang

02.11.2018 16:20:06


Please leave your feedback about this article