Các tùy chọn OCR

Chọn tùy chọn OCR đúng rất quan trọng nếu bạn muốn có kết quả nhanh, chính xác. Khi quyết định bạn muốn sử dụng tùy chọn nào, bạn phải cân nhắc không chỉ loại và mức độ phức tạp của tài liệu của bạn mà còn cách bạn định sử dụng các kết quả. Các nhóm tùy chọn sau đây có sẵn:

Bạn có thể tìm thấy các tùy chọn OCR trong tab OCR của hộp thoại Tùy chọn (nhấp  Công cụ > Tùy chọn... để mở hộp thoại này).

ABBYY FineReader tự động nhận dạng mọi trang bạn thêm vào dự án OCR. Các tùy chọn hiện đã chọn sẽ được sử dụng cho OCR. Bạn có thể tắt tự động phân tích và OCR hình ảnh mới được thêm trong tab Đang xử lý hình ảnh của hộp thoại Tùy chọn (nhấp Công cụ > Tùy chọn... để mở hộp thoại này).

Nếu bạn thay đổi các tùy chọn OCR sau khi tài liệu đã được nhận dạng, chạy lại quy trình OCR để nhận dạng tài liệu bằng các tùy chọn mới.

Chế độ nhận dạng PDF

Cài đặt này được sử dụng cho tài liệu PDF có nhiều lớp văn bản và ảnh. Tài liệu PDF như vậy thường được tạo từ tài liệu ở các định dạng có thể chỉnh sửa. Các loại tài liệu PDF khác như tài liệu PDF có thể tìm kiếm và PDF chỉ hình ảnh luôn được xử lý ở chế độ Sử dụng OCR, đây là chế độ mặc định đối với các loại tài liệu PDF này. Không có cài đặt bổ sung nào được yêu cầu để xử lý tài liệu PDF như vậy.

Có sẵn ba chế độ nhận dạng:

  • Tự động chọn giữa OCR và Văn bản từ PDF
    Chương trình sẽ xem chi tiết lớp văn bản và sử dụng lớp văn bản hiện có nếu lớp văn bản này có văn bản chất lượng tốt. Nếu không, OCR sẽ được sử dụng để tạo một lớp văn bản mới.
  • Sử dụng OCR
    OCR sẽ được sử dụng để tạo một lớp văn bản mới. Chế độ này sẽ tốn nhiều thời gian hơn nhưng phù hợp hơn với tài liệu có các lớp văn bản chất lượng kém.
  • Chỉ sử dụng văn bản từ PDF
    Đây là chế độ mặc định cho tài liệu PDF có nhiều lớp văn bản. Chương trình sẽ sử dụng lớp văn bản gốc mà không chạy OCR.

Cân bằng giữa tốc độ và độ chính xác OCR

ABBYY FineReader 14 cho phép bạn thực hiện:

  • Nhận dạng sâu
    Trong chế độ này, ABBYY FineReader phân tích và nhận dạng cả tài liệu đơn giản và tài liệu có bố cục phức tạp, thậm chí cả tài liệu có văn bản in trên nền màu hoặc đường quét và tài liệu có bảng phức hợp (bao gồm bảng có đường lưới màu trắng và bảng có ô màu).
    Nhận dạng sâu cần nhiều thời gian hơn nhưng đem lại chất lượng tốt hơn.
  • Nhận dạng nhanh
    Chế độ này được đề xuất để xử lý tài liệu lớn có bố cục đơn giản và hình ảnh chất lượng tốt.

Kiểu in

Chỉ định loại thiết bị đã được sử dụng để in tài liệu. Xem thêm: Các tính năng của tài liệu cần xem xét trước khi OCR.

Phát hiện thành phần cấu trúc

Chọn các thành phần cấu trúc mà bạn muốn chương trình phát hiện: đầu trang và chân trang, chú thích cuối trang, mục lục và danh sách. Những thành phần đã chọn sẽ có thể nhấp vào được khi tài liệu được lưu.

Mã vạch

Nếu tài liệu của bạn chứa mã vạch và bạn muốn chuyển đổi chúng sang chuỗi chữ cái và chữ số mà không muốn lưu dưới dạng ảnh, chọn Chuyển đổi mã vạch thành chuỗi. Tính năng này bị tắt theo mặc định.

Mẫu và ngôn ngữ

Nhận dạng và lập mẫu được sử dụng để nhận dạng các loại văn bản sau:

  • Văn bản có các ký hiệu đặc biệt (ví dụ: ký hiệu toán học)
  • Văn bản có các thành phần trang trí
  • Khối lượng lớn văn bản từ hình ảnh chất lượng kém (trên 100 trang)

Lập mẫu được tắt theo mặc định. Bật Đào tạo để nhận dạng ký tự và chữ dính mới để lập mẫu cho ABBYY FineReader khi thực hiện OCR.

Bạn có thể sử dụng các mẫu có sẵn hoặc của riêng bạn để nhận dạng.

Bạn có thể lưu và tải cài đặt cho mẫu người dùng và ngôn ngữ. Xem thêm: Dự án OCR.

Phông chữ

Tại đây bạn có thể chọn phông chữ sẽ được sử dụng khi lưu văn bản được nhận dạng.

Để chọn phông chữ:

  1. Nhấp vào nút Chọn phông chữ....
  2. Chọn phông chữ mong muốn và nhấp OK.

11/2/2018 4:20:06 PM


Please leave your feedback about this article