Nếu tài liệu in của bạn chứa phông chữ phi tiêu chuẩn

Chế độ lập mẫu cải thiện chất lượng OCR trên tài liệu có phông chữ trang trí hoặc tài liệu chứa các ký tự đặc biệt (ví dụ: ký hiệu toán học).

Lưu ý: Bạn không nên sử dụng chế độ lập mẫu trong các trường hợp khác, vì kết quả thu được về chất lượng nhận dạng sẽ không đáng kể so với thời gian và công sức bạn bỏ ra để lập mẫu.

Trong chế độ lập mẫu, mẫu người dùng được tạo có thể được sử dụng khi thực hiện OCR trên toàn bộ văn bản.

Sử dụng mẫu người dùng

Để sử dụng mẫu để nhận dạng tài liệu:

  1. Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.
  2. Trong Huấn luyện, chọn tùy chọn Chỉ sử dụng mẫu người dùng.

Lưu ý: Nếu bạn chọn Sử dụng mẫu có sẵn và người dùng, ABBYY FineReader 12 sẽ sử dụng cả mẫu người dùng và mẫu được đặt trước khi xuất xưởng để OCR.

  1. Nhấp vào nút Trình biên tập mẫu….
  2. Trong hộp thoại Trình biên tập mẫu, chọn mẫu mong muốn rồi nhấp OK.
  3. Trong cửa sổ chính ABBYY FineReader, nhấp vào nút Đọc.

Tạo và lập mẫu người dùng

Để lập mẫu nhận dạng riêng để nhận dạng các ký tự và chữ dính mới:

  1. Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.
  2. Trong Huấn luyện, chọn Sử dụng mẫu có sẵn và người dùng hoặc Chỉ sử dụng mẫu người dùng.
  3. Chọn tùy chọn Đọc và huấn luyện.
  4. Nhấp vào nút Trình biên tập mẫu….

Lưu ý: Không hỗ trợ lập mẫu cho ngôn ngữ châu Á.

  1. Trong hộp thoại Trình biên tập mẫu, nhấp vào Mới…
  2. Hộp thoại Tạo mẫu sẽ mở ra. Nhập tên của mẫu người dùng và nhấp OK.
  3. Đóng hộp thoại Trình biên tập mẫuTùy chọn bằng cách nhấp vào nút OK trong mỗi hộp thoại.
  4. Trên thanh công cụ ở đầu cửa sổ Hình ảnh, nhấp vào Đọc.

Giờ đây, nếu ABBYY FineReader gặp một ký tự chưa xác định, ký tự này sẽ được hiển thị trong hộp thoại Đào tạo về mẫu chữ.

  1. Hướng dẫn chương trình đọc các ký tựchữ dính mới.

Chữ dính là tổ hợp của hai hay ba ký tự bị "dính vào nhau" (ví dụ: fi, fl, ffi, v.v..) và làm cho chương trình khó tách riêng. Thực tế, có thể đạt được các kết quả tốt hơn bằng cách coi chúng là các ký tự ghép.

Lưu ý: Các từ được in kiểu in đậm hoặc in nghiêng trong văn bản của bạn hoặc các từ trong ký tự trên đầu/ký tự dưới chân có thể được giữ lại trong văn bản nhận dạng bằng cách chọn các tùy chọn tương ứng trong Hiệu ứng.

Để quay lại ký tự đã lập mẫu trước đó, nhấp vào nút Quay lại. Khung sẽ chuyển tới vị trí trước và tương ứng "hình ảnh ký tự - ký tự bàn phím" được lập mẫu gần nhất sẽ bị xóa khỏi mẫu. Nút Quay lại điều hướng giữa các ký tự của một từ và sẽ không điều hướng giữa các từ.

Quan trọng!

  • Bạn chỉ có thể lập mẫu cho ABBYY FineReader đọc các ký tự có trong bảng chữ cái của ngôn ngữ nhận dạng. Để lập mẫu cho chương trình đọc các ký tự không thể nhập từ bàn phím, sử dụng kết hợp hai ký tự để biểu thị những ký tự không tồn tại này hoặc sao chép ký tự mong muốn từ hộp thoại Chèn ký tự (nhấp vào   để mở hộp thoại).
  • Mỗi mẫu có thể chứa tối đa 1.000 ký tự mới. Tuy nhiên, tránh tạo quá nhiều chữ dính vì điều này có thể ảnh hưởng xấu đến chất lượng OCR.

Chọn mẫu người dùng

ABBYY FineReader cho phép bạn sử dụng mẫu để cải thiện chất lượng OCR

  1. Trên menu Công cụ, nhấp vào Trình biên tập mẫu….
  2. Trong hộp thoại Trình biên tập mẫu, chọn mẫu mong muốn từ danh sách các mẫu sẵn có và nhấp vào Đặt mẫu hiện hoạt.

Một số điểm quan trọng cần ghi nhớ:

  1. Thay vì phân biệt một số ký tự tương tự là khác nhau, ABBYY FineReader nhận dạng chúng là một ký tự giống nhau. Ví dụ: dấu ngoặc thẳng ('), trái (‘) và phải (’) sẽ được lưu trữ trong một mẫu dưới dạng một ký tự duy nhất (dấu ngoặc thẳng). Điều này có nghĩa là dấu ngoặc trái và phải sẽ không bao giờ được sử dụng trong văn bản được nhận dạng, ngay cả khi bạn cố gắng lập mẫu chúng.
  2. Đối với một số hình ảnh ký tự, ABBYY FineReader sẽ chọn ký tự bàn phím tương ứng dựa trên ngữ cảnh xung quanh. Ví dụ: hình ảnh hình tròn nhỏ sẽ được nhận dạng là chữ O nếu có các chữ cái ngay bên cạnh nó và là số 0 nếu có các chữ số bên cạnh nó.
  3. Mẫu chỉ có thể được sử dụng cho các tài liệu có phông chữ, cỡ phông và độ phân giải như tài liệu được dùng để tạo mẫu.
  4. Để có thể sử dụng một mẫu sau này, lưu mẫu vào một tệp. Xem "Tài liệu FineReader là gì?" để biết chi tiết.
  5. Để nhận dạng văn bản được thiết lập trong phông chữ khác, đảm bảo vô hiệu mẫu người dùng bằng cách chọn tùy chọn Chỉ sử dụng mẫu có sẵn trong Công cụ > Tùy chọn… > Đọc.

Chỉnh sửa mẫu người dùng

Bạn có thể muốn chỉnh sửa mẫu mới tạo của mình trước khi khởi chạy quy trình OCR. Mẫu được lập không chính xác có thể ảnh hưởng xấu đến chất lượng OCR. Mẫu chỉ được chứa toàn bộ ký tự hoặc chữ dính. Các ký tự có cạnh bị cắt và các ký tự có sự tương ứng chữ cái không chính xác phải được xóa khỏi mẫu.

  1. Trên menu Công cụ, nhấp vào Trình biên tập mẫu….
  2. Hộp thoại Trình biên tập mẫu sẽ mở ra. Chọn mẫu mong muốn và nhấp vào nút Chỉnh sửa….
  3. Trong hộp thoại Mẫu chữ của người dùng mở ra, chọn một ký tự và nhấp vào nút Thuộc tính….

Trong hộp thoại mở ra:

  • Nhập chữ cái tương ứng với ký tự trong trường Ký tự
  • Chỉ định hiệu ứng phông chữ mong muốn (in đậm, in nghiêng, ký tự trên đầu và ký tự dưới chân) trong trường Hiệu ứng.

Nhấp vào nút Xóa trong hộp thoại Mẫu chữ của người dùng để xóa ký tự đã được lập mẫu không chính xác.

14.01.2020 17:26:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.