Opcje OCR

Wybranie odpowiednich opcji OCR jest ważne, gdy chce się szybko uzyskać dokładne wyniki. Podejmując decyzję których opcji użyć, należy rozważyć nie tylko typ i złożoność dokumentu, ale również docelowe zastosowanie wyników. Dostępne są następujące grupy opcji:

Opcje OCR można znaleźć na zakładce OCR okna dialogowego Opcje (kliknij Narzędzia > Opcje... aby otworzyć to okno dialogowe).

Program ABBYY FineReader automatycznie rozpoznaje strony dodane do projektu OCR. Do rozpoznawania zostaną użyte aktualnie wybrane ustawienia. Automatyczną analizę nowo dodanych obrazów można wyłączyć na zakładce Przetwarzanie obrazów okna dialogowego Opcje (kliknij Narzędzia > Opcje... aby otworzyć to okno dialogowe).

Jeśli opcje OCR zostaną zmienione po rozpoznaniu dokumentu, należy ponownie uruchomić proces OCR, aby rozpoznać dokument z nowymi opcjami.

Tryby rozpoznawania dokumentów PDF

Ustawienia te są przeznaczone dla dokumentów PDF zawierających warstwę tekstową i obrazy. Dokumenty takie są zazwyczaj tworzone z dokumentów w formatach edytowalnych. Inne typy dokumentów PDF, takie jak przeszukiwalne pliki PDF i pliki PDF zawierające tylko obrazy, zawsze są przetwarzane w trybie Użyj OCR, który jest dla nich trybem domyślnym. Do przetwarzania takich dokumentów PDF nie są potrzebne żadne dodatkowe ustawienia.

Dostępne są trzy tryby rozpoznawania:

    • Automatycznie wybieraj między OCR a tekstem z PDF
      Program zbada warstwę tekstową i użyje jej, jeśli stwierdzi, że zawiera tekst dobrej jakości. W przeciwnym razie program utworzy nową warstwę tekstową za pomocą procesu OCR.
    • Użyj OCR
      Nowa warstwa zostanie utworzona za pomocą procesu OCR. Ten tryb zajmuje więcej czasu, ale jest bardziej odpowiedni dla dokumentów zawierających warstwę tekstową niskiej jakości.
    • Użyj tylko tekstu z PDF
      Jest to domyślny tryb dla dokumentów PDF z warstwą tekstową. Program użyje oryginalnej warstwy tekstowej bez uruchamiania procesu OCR.

Równowaga między prędkością a dokładnością OCR

ABBYY FineReader PDF 15 pozwala na:

  • Dokładne rozpoznawanie
    W tym trybie program ABBYY FineReader analizuje i rozpoznaje zarówno proste dokumenty, jak i dokumenty o skomplikowanych układach stron, w szczególności dokumenty z kolorowym tłem oraz dokumenty zawierające złożone tabele (z białymi liniami oddzielającymi i zawierające kolorowe komórki).
    Dokładne rozpoznawanie pochłania więcej czasu, ale zapewnia lepszą jakość.
  • Szybkie rozpoznawanie
    Ten tryb jest zalecany do przetwarzania dużych dokumentów o prostym układzie stron i obrazach dobrej jakości.

Typ druku

Określa typ urządzenia, za pomocą którego wydrukowano dokument. Zobacz również: Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania OCR.

Wykrywanie elementów strukturalnych

Wybierz elementy strukturalne, które program ma wykryć: nagłówki i stopki, przypisy, spisy treści i listy. Wybrane elementy będą klikalne po zapisaniu dokumentu.

Kody kreskowe

Jeśli dokument zawiera kody kreskowe, które użytkownik chciałby zamienić w ciągi liter i cyfr, zamiast zapisywać je jako obrazy, należy wybrać opcję Konwertuj kody kreskowe na ciągi. Ta opcja jest domyślnie wyłączona.

Wzorce i języki

Rozpoznawanie z douczaniem stosuje się do rozpoznawania następujących typów tekstu:

  • zawierających symbole specjalne (np. matematyczne),
  • zawierających elementy dekoracyjne,
  • zawierających duże ilości tekstu z obrazów o niskiej jakości (powyżej 100 stron).

Douczanie domyślnie jest wyłączone. Włącz, Trenuj, aby rozpoznawać nowe znaki i ligatury aby douczać program ABBYY FineReader podczas procesu OCR.

Możesz używać zarówno wbudowanych jak i własnych wzorców rozpoznawania.

Możesz zapisać i wczytać ustawienia wzorców i języków użytkownika. Zobacz również: Projekt OCR.

Czcionki

Na tej zakładce można wybrać czcionki do zapisania rozpoznanego tekstu.

Aby wybrać czcionki:

  1. Kliknij przycisk Wybierz czcionki....
  2. Wybierz czcionki i kliknij przycisk OK.

9/7/2020 8:12:25 PM


Please leave your feedback about this article