Jeśli drukowany dokument zawiera niestandardowe czcionki

Jeżeli dokument przeznaczony do rozpoznawania tekstu zawiera czcionki ozdobne lub znaki specjalne (np. symbole matematyczne), zalecane jest stosowanie trybu douczania w celu zwiększenia dokładności rozpoznawania.

Nie zaleca się używania trybu douczania w innych przypadkach, ponieważ polepszenie jakości rozpoznawania będzie nieznaczne w porównaniu z ilością czasu i wysiłku, jakie trzeba poświęcić na douczanie.

W trybie douczania tworzony jest wzorzec użytkownika, który może być wykorzystywany do rozpoznawania  OCR w całym tekście.

Używanie wzorców użytkownika

W celu użycia wzorca użytkownika do rozpoznania dokumentu:

  1. Kliknij Narzędzia > Opcje... aby otworzyć okno dialogowe Opcje okno dialogowe, po czym kliknij zakładkę OCR.
  2. Wybierz opcję Używaj szablonów użytkownika.
    Jeżeli wybrana zostanie opcja Użyj także wzorców wbudowanych znajdująca się pod opcją Używaj szablonów użytkownika, ABBY FineReader wykorzysta swoje wbudowane wzorce oprócz wzorców utworzonych przez użytkownika.
  3. Kliknij przycisk Edytor wzorców....
  4. W polu Edytor wzorców wybierz wzorzec i kliknij OK.
  5. Kliknij przycisk na głównym pasku narzędzi u góry okna edytora OCR.

Tworzenie i douczanie wzorca użytkownika

Aby douczyć wzorzec użytkownika rozpoznawania nowych znaków i ligatur:

  1. Kliknij Narzędzia > Opcje... aby otworzyć okno dialogowe Opcje okno dialogowe, po czym kliknij zakładkę OCR.
  2. Wybierz opcję Trenuj, aby rozpoznawać nowe znaki i ligatury.
    Jeżeli wybrana zostanie opcja Użyj także wzorców wbudowanych znajdująca się pod opcją Trenuj, aby rozpoznawać nowe znaki i ligatury, ABBY FineReader wykorzysta swoje wbudowane wzorce oprócz wzorców utworzonych przez użytkownika.
  3. Kliknij przycisk Edytor wzorców....
    Funkcja douczania wzorców jest niedostępna dla języków azjatyckich.
  4. W polu Edytor wzorców kliknij przycisk Nowy....
  5. W polu Utwórz wzorzec wpisz nazwę nowego wzorca i kliknij OK.
  6. Kliknij OK w polu Edytor wzorców dialogowym, a następnie kliknij OK w polu Opcje.
  7. Kliknij przycisk na pasku narzędzi u góry okna Obraz.
    Jeżeli program napotka znak, którego nie może rozpoznać, otworzy się Douczanie wzorca okno dialogowe, w którym zostanie wyświetlony ten znak.
  8. Naucz program rozpoznawać nowe znaki i ligatury.
    Ligatura to kombinacja dwóch lub trzech znaków, które są ze sobą „sklejone” (na przykład fi, fl, ffi itd.), przez co programowi trudno jest je rozdzielić. W rzeczywistości lepsze wyniki uzyska się, jeśli takie znaki zostaną potraktowane jako pojedyncze znaki złożone.
    Słowa drukowane pogrubioną czcionką lub kursywą, lub w indeksie górnym bądź dolnym mogą zostać zachowane w rozpoznanym tekście poprzez wybranie odpowiednich opcji w oknie Efekty.
    Aby wrócić do poprzednio wyuczonego znaku, należy kliknąć przycisk Powrуt. Ramka zostanie przeniesiona do poprzedniej lokalizacji, a ostatnia wyuczona para „obraz znaku-znak klawiaturowy” zostanie usunięta z wzorca. Przycisk Powrуt umożliwia nawigację pomiędzy znakami w jednym słowie, ale nie pomiędzy słowami.

Ważne!

  • Można douczać program ABBYY FineReader PDF 15 rozpoznawania jedynie tych znaków, które znajdują się w alfabecie rozpoznawanego języka. Aby douczyć program rozpoznawania znaków, niedostępnych bezpośrednio na klawiaturze, można użyć połączenia dwóch znaków w celu oznaczenia tych nieistniejących znaków lub skopiować potrzebny znak z okna dialogowego Wstaw znak (kliknij  aby otworzyć to okno dialogowe).
  • Każdy wzorzec może zawierać do 1000 nowych znaków. Jednakże należy unikać tworzenia zbyt wielu ligatur, ponieważ może to pogorszyć jakość rozpoznawania OCR.

Wybieranie wzorca użytkownika

W programie ABBYY FineReader można stosować wzorce w celu poprawienia jakości rozpoznawania OCR.

  1. Kliknij Narzędzia > Edytor wzorców....
  2. W polu Edytor wzorców wybierz jeden z wzorców z listy i kliknij przycisk Uaktywnij.

Niektóre ważne kwestie do zapamiętania:

  1. Czasami program nie będzie rozróżniać bardzo podobnych, choć różnych znaków i będzie je rozpoznawać jako ten sam znak. Na przykład znaki cudzysłowu prostego ('), lewego (‘) i prawego (’) będą zapisane we wzorcu jako jeden znak (cudzysłów prosty). Oznacza to, że cudzysłów lewy i prawy nigdy nie będą stosowane w rozpoznawanym tekście, nawet jeżeli spróbujesz douczyć program tych znaków.
  2. W przypadku obrazów niektórych znaków program ABBYY FineReader PDF 15 wybierze odpowiedni znak klawiaturowy w oparciu o kontekst. Na przykład obraz małego okręgu zostanie rozpoznany jako litera O, gdy w jego otoczeniu będą znajdować się litery lub jako cyfra 0 — gdy sąsiaduje z cyframi.
  3. Wzorca należy używać tylko do rozpoznawania dokumentów z taką samą czcionką, rozmiarem czcionki i rozdzielczością, w jakiej zostało przeprowadzone tworzenie wzorca.
  4. Użytkownik może zapisać swój wzorzec do pliku i używać go w innych projektach OCR. Zobacz również: Projekty OCR.
  5. Aby rozpoznać tekst zapisany inną czcionką, nie należy używać wzorca użytkownika. W tym celu kliknijNarzędzia > Opcje... aby otworzyć okno dialogowe Opcje kliknij przycisk OCR i wybierz opcję Użyj wzorców wbudowanych.

Edytowanie wzorca użytkownika

Użytkownik może zechcieć edytować najnowszy utworzony wzorzec przed rozpoczęciem procesu rozpoznawania OCR. Źle douczony wzorzec może pogorszyć jakość rozpoznawania OCR. Wzorzec powinien zawierać wyłącznie całe znaki lub ligatury. Znaki z odciętymi krawędziami oraz znaki ze źle sparowanymi literami powinny być usunięte z wzorca.

  1. Kliknij Narzędzia > Edytor wzorców....
  2. W polu Edytor wzorców wybierz wzorzec, który chcesz edytować i kliknij przycisk Edytuj....
  3. W polu Wzorzec uїytkownika dialogowym wybierz znak i kliknij przycisk Wіaњciwoњci....

W otwartym oknie dialogowym:

  • W polu Znak wpisz literę, która odpowiada znakowi.
  • W polu Efekty wybierz żądane atrybuty czcionki (pogrubienie, kursywa, indeks górny lub dolny).

Aby usunąć znak, w odniesieniu do którego program został źle douczony, kliknij przycisk Usuс w oknie dialogowym Wzorzec uїytkownika.

07.09.2020 20:12:25


Please leave your feedback about this article