Các dự án OCR

Khi làm việc với chương trình, bạn có thể lưu kết quả tạm thời trong Dự án OCR để bạn có thể tiếp tục công việc của mình ở nơi bạn dừng lại. Dự án OCR chứa hình ảnh nguồn, văn bản đã được nhận dạng trong hình ảnh, các cài đặt chương trình của bạn và bất kỳ mẫu người dùng, ngôn ngữ hoặc nhóm ngôn ngữ nào mà bạn đã tạo.

Phần này bao quát các chủ đề sau:

Mở dự án OCR

Khi khởi chạy OCR Editor, một dự án OCR mới được tạo theo mặc định. Bạn có thể làm việc với dự án OCR mới này hoặc mở một dự án hiện có.

Để mở một dự án OCR hiện có:

  1. Nhấp Tệp > Mở Dự án OCR....
  2. Trong hộp thoại mở ra, chọn dự án OCR bạn muốn mở.

Nếu bạn mở một dự án OCR đã được tạo bằng phiên bản chương trình cũ hơn, ABBYY FineReader sẽ cố gắng chuyển đổi dự án này sang định dạng mới được phiên bản hiện tại sử dụng. Việc chuyển đổi này không thể hoàn tác, vì thế bạn sẽ được nhắc lưu dự án OCR của bạn dưới một tên khác. Văn bản được nhận dạng từ dự án cũ sẽ không được chuyển sang dự án mới. Để nhận dạng các trang trong dự án OCR, nhấp vào nút.

Gợi ý. Nếu bạn muốn mở dự án OCR được sử dụng gần đây nhất khi khởi chạy OCR Editor, chọn Mở Dự án OCR trước trên Thông thường của hộp thoại Tùy chọn hộp thoại (nhấp Công cụ > Tùy chọn... để mở hộp thoại này).

Bạn cũng có thể nhấp chuột phải vào một dự án OCR trong Windows Explorer và chọn Mở Dự án OCR bằng ABBYY FineReader 14. Các dự án OCR được đánh dấu bằng biểu tượng .

Sử dụng cài đặt từ các phiên bản trước của ABBYY FineReader

ABBYY FineReader 14 cho phép bạn nhập từ điển người dùng và cài đặt chương trình từ các tệp được tạo trong các phiên bản trước của chương trình.

Để sử dụng từ điển được tạo trong ABBYY FineReader 10, 11 hoặc 12:

  1. Nhấp Công cụ > Xem từ điển....
  2. Trong Từ điển người dùng chọn ngôn ngữ từ điển và nhấp vào Xem....
  3. Trong Từ điển cho..., nhấp Nhập... và chỉ định đường dẫn đến từ điển.
  4. Chọn tệp từ điển và nhấp vào Mở.

Thêm hình ảnh vào dự án OCR

  1. Nhấp Tệp > Mở hình ảnh....
  2. Trong hộp thoại mở ra, chọn một hoặc nhiều hình ảnh và nhấp vào Mở. Hình ảnh sẽ được đính vào cuối dự án OCR đang mở và các bản sao của hình ảnh sẽ được lưu trong thư mục dự án OCR.

Bạn cũng có thể nhấp chuột phải vào các hình ảnh trong Windows Explorer và chọn Chuyển đổi với ABBYY FineReader 14 > Mở trong OCR Editor trên trình đơn lối tắt. Các tệp được chọn sẽ được thêm vào một dự án OCR mới.

Bạn cũng có thể thêm các ảnh quét tài liệu. Xem thêm: Quét tài liệu giấy.

Xóa trang khỏi dự án OCR

  • Trong Trang chọn một trang và nhấp vào Xóa, hoặc
  • Nhấp Chỉnh sửa > Xóa Trang..., hoặc
  • Nhấp chuột phải vào một trang trong ngăn Trang và chọn Xóa... trên trình đơn lối tắt.

Bạn có thể chọn và xóa nhiều hơn một trang trong ngăn Trang.

Lưu dự án OCR

  1. Nhấp Tệp > Lưu Dự án OCR....
  2. Trong hộp thoại mở ra, nhập tên cho dự án OCR của bạn và chỉ định thư mục lưu dự án.

Khi bạn lưu một dự án OCR, không chỉ hình ảnh trang và văn bản đã nhận dạng mà bất cứ mẫu và ngôn ngữ nào mà bạn đã tạo khi làm việc trong dự án cũng được lưu.

Đóng dự án OCR

  • Để đóng dự án OCR, nhấp vào Tệp > Đóng.

Tách một dự án OCR thành nhiều dự án

Khi xử lý số lượng lớn các tài liệu nhiều trang, thông thường sẽ thực tế hơn khi quét tất cả tài liệu trước rồi sau đó mới phân tích và nhận dạng chúng. Tuy nhiên, để giữ nguyên định dạng gốc của từng tài liệu giấy một cách chính xác, ABBYY FineReader phải xử lý từng tài liệu dưới dạng một dự án OCR riêng. ABBYY FineReader bao gồm các công cụ để nhóm các trang được quét thành các dự án OCR riêng biệt.

Để tách một dự án OCR:

  1. Nhấp chuột phải vào bất kỳ đâu trong ngăn Trang và chọn Di chuyển các trang Dự án OCR mới... trên trình đơn lối tắt.
  2. Trong hộp thoại mở ra, tạo số lượng dự án OCR cần thiết bằng cách nhấp vào Thêm Dự án OCR nút.
  3. Di chuyển trang từ ngăn Trang sang dự án khác bằng một trong các phương pháp sau:
    • Chọn trang và dùng chuột để kéo trang.
      Bạn cũng có thể sử dụng kéo và thả để di chuyển trang giữa các dự án OCR.
    • Sử dụng ChuyểnĐưa trở lại. Ngăn Di chuyển sẽ di chuyển trang đến dự án hiện tại.
    • Bấm Ctrl+Mũi tên phải để di chuyển các trang được chọn từ ngăn Trang đến dự án OCR hiện tại hoặc bấm Ctrl+Mũi tên trái hoặc Xóa để di chuyển các trang này trở về dự án ban đầu.
  4. Khi đã hoàn tất, nhấp vào Tạo để tạo dự án OCR mới hoặc Tạo tất cả để tạo tất cả các dự án chỉ trong một bước.

Gợi ý. Bạn cũng có thể kéo và thả các trang đã chọn từ ngăn Trang sang một đối tượng khác của OCR Editor. Các trang được chọn sẽ được đính vào cuối dự án OCR.

Xếp lại thứ tự trang trong dự án OCR

  1. Trong Trang chọn một hoặc nhiều trang.
  2. Nhấp chuột phải vào bất kỳ đâu trong ngăn Trang và chọn Xếp lại thứ tự trang... trên trình đơn lối tắt.
  3. Trong Xếp lại thứ tự trang chọn một trong các tùy chọn sau:
    • Xếp lại thứ tự trang (không thể hoàn tác)
      Thao tác này sẽ thay đổi tất cả số trang một cách lần lượt, bắt đầu với trang được chọn.
    • Khôi phục thứ tự trang gốc sau khi quét hai mặt
      Tùy chọn này khôi phục đánh số trang ban đầu của tài liệu có các trang hai mặt. Tùy chọn này hữu ích nếu bạn sử dụng máy quét có khay nạp giấy tự động để quét tất cả các trang đánh số lẻ trước rồi đến tất cả các trang đánh số chẵn. Bạn có thể chọn thứ tự bình thường và đảo ngược cho các trang đánh số chẵn.
      Tùy chọn này sẽ chỉ hoạt động nếu từ ba trang được đánh số liên tiếp trở lên được chọn.
    • Đổi trang sách
      Tùy chọn này hữu ích nếu bạn quét một cuốn sách viết bằng chữ viết từ trái sang phải và tách các trang đối diện mà không chỉ định được ngôn ngữ chính xác.
      Tùy chọn này chỉ hữu ích nếu từ hai trang được đánh số liên tiếp trở nên được chọn và ít nhất hai trong số các trang này đối diện nhau.
      Để hủy thao tác này, chọn Hoàn tác thao tác cuối.
  4. Nhấp OK.

Các trang trong ngăn Trang sẽ được xếp lại theo số trang mới.

Ở chế độ xem Hình thu nhỏ bạn có thể thay đổi cách đánh số trang thật đơn giản bằng cách kéo các trang đã chọn tới vị trí mong muốn trong dự án OCR.

Metadata

Siêu dữ liệu của tài liệu chứa thông tin chi tiết về tài liệu như tác giả, chủ đề và từ khóa của tài liệu. Siêu dữ liệu của tài liệu có thể được sử dụng để sắp xếp các tệp và kiểm tra thuộc tính tài liệu. Tài liệu cũng có thể được tìm kiếm bằng siêu dữ liệu.
Khi nhận dạng tài liệu PDF và các loại tệp hình ảnh nhất định, ABBYY FineReader sẽ kết xuất siêu dữ liệu của tài liệu nguồn. Bạn có thể chỉnh sửa siêu dữ liệu này nếu cần.

Để thêm hoặc sửa đổi siêu dữ liệu của tài liệu:

  1. Mở tab Cài đặt định dạng của hộp thoại Tùy chọn hộp thoại (nhấp Công cụ > Tùy chọn... để mở hộp thoại này).
  2. Nhấp vào Chỉnh sửa siêu dữ liệu... và trong hộp thoại mở ra, nhập tên, tác giả, chủ đề và từ khóa cho tài liệu.
  3. Nhấp OK.

Làm việc với mẫu và ngôn ngữ

Bạn có thể lưu và tải mẫu người dùng và ngôn ngữ.

Để biết thêm về các mẫu, xem Nếu tài liệu của bạn chứa phông chữ phi tiêu chuẩn. Để biết thêm về ngôn ngữ người dùng, xem Nếu chương trình không nhận dạng được một số ký tự.

Để lưu mẫu và ngôn ngữ vào một tệp:

  1. Mở tab OCR của hộp thoại Tùy chọn hộp thoại (nhấp Công cụ > Tùy chọn... để mở hộp thoại này).
  2. Nhấp vào Lưu mẫu và ngôn ngữ...
  3. Trong hộp thoại mở ra, nhập tên cho tệp của bạn và nhấp Lưu.

Tệp này sẽ chứa đường dẫn tới thư mục lưu trữ ngôn ngữ người dùng, nhóm ngôn ngữ, từ điển và mẫu của bạn.

Để tải mẫu và ngôn ngữ:

  1. Mở tab OCR của hộp thoại Tùy chọn hộp thoại (nhấp Công cụ > Tùy chọn... để mở hộp thoại này).
  2. Nhấp vào Tải mẫu và ngôn ngữ...
  3. Trong Tùy chọn tải chọn tệp *.fbt yêu cầu và nhấp Mở.

02.11.2018 16:20:06


Please leave your feedback about this article