Jeśli program nie rozpoznaje niektórych znaków

Program ABBYY FineReader PDF 15 do rozpoznawania tekstu wykorzystuje dane o języku dokumentu. Program może nie rozpoznać niektórych znaków w dokumentach zawierających nieznane elementy (np. liczby kodowe), ponieważ język dokumentu może nie zawierać tych znaków. W celu rozpoznania takich dokumentów można utworzyć niestandardowy język zawierający wszystkie potrzebne znaki. Można również utworzyć grupy kilku języków OCR i korzystać z tych grup podczas rozpoznawania dokumentów.

Jak utworzyć nowy język użytkownika

  1. Otwórz kartę Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe), kliknij przycisk Języki.
  2. Kliknij przycisk Nowy....
  3. W oknie dialogowym, które zostanie otwarte, wybierz opcję Utworzyć nowy język na bazie istniejącego, wybierz język, który posłuży jako baza do utworzenia nowego języka i kliknij OK.
  4. Pasek Właściwości języka. W oknie tym:
    1. Wpisz nazwę nowego języka.
    2. Język, który został wybrany w oknie dialogowym Nowy język lub grupa jest wyświetlony na liście rozwijanej Język źródłowy. Z listy tej można wybrać inny język.
    3. Pasek Alfabet zawiera alfabet języka bazowego. Jeśli chcesz edytować alfabet, kliknij przycisk .
    4. Pasek opcji Słownik zawiera kilka opcji dotyczących słownika, które będą wykorzystywane przez program przy rozpoznawaniu tekstu i sprawdzaniu wyników:
      • Brak
        Brak słownika dla tego języka.
      • Słownik wbudowany
        Zostanie zastosowany wbudowany słownik programu.
      • Słownik użytkownika
        Kliknij przycisk Edytuj..., aby określić terminy słownikowe lub zaimportować istniejący niestandardowy słownik albo plik tekstowy o kodowaniu Windows-1252 (terminy muszą być oddzielone spacjami lub innymi nienależącymi do alfabetu znakami).
        Słowa ze słownika użytkownika nie zostaną oznaczone jako niepoprawne w procesie sprawdzania pisowni rozpoznanego tekstu. Mogą być napisane samymi małymi lub wielkimi literami albo wszystkie zaczynać się wielką literą.
Słowo w słowniku Słowa, które nie zostaną uznane za niepoprawne podczas sprawdzania pisowni
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Pasek Wyrażenie regularne pozwala utworzyć słownik użytkownika z wykorzystaniem wyrażeń regularnych.
    Zobacz również: Wyrażenia regularne.
  1. Języki mogą mieć kilka dodatkowych właściwości. Aby zmienić te właściwości, kliknij przycisk Zaawansowane..., aby otworzyć okno dialogowe Zaawansowane właściwości języka, w którym można określić:
    • Znaki, które mogą znajdować się na początku lub końcu słowa
    • Znaki niebędące literami, które występują oddzielnie od słów
    • Znaki, które mogą występować w środku słowa, lecz powinny być ignorowane
    • Znaki, które nie mogą występować w tekście rozpoznawanym przy użyciu tego języka (znaki zabronione)
    • Pasek Tekst może zawierać liczebniki arabskie, liczebniki rzymskie i skróty Opcja
  2. Teraz podczas wybierania języków OCR można wybrać nowo utworzony język.
    Więcej informacji na temat języków OCR — zob. Języki OCR.

Domyślnie języki użytkownika są zapisywane w folderze projektu OCR. Można też zapisać wszystkie języki i wzorce użytkownika w jednym pliku. W tym celuotwórz okno dialogowe Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe), kliknij przycisk OCR, a następnie kliknij przycisk Zapisz wzorce i języki....

Tworzenie grupy języków

Jeśli zamierzasz regularnie używać pewnej kombinacji języków, możesz rozważyć pogrupowanie języków dla wygody.

  1. Otwórz kartę Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe) i kliknij kartę Języki.
  2. Kliknij przycisk Nowy....
  3. W polu Nowy język lub grupa wybierz opcję Utworzyć nową grupę języków i kliknij OK.
  4. Zostanie otwarte okno dialogowe Właściwości grupy języków. W oknie tym podaj nazwę grupy języków i wybierz języki, które chcesz w niej umieścić.
    Jeśli wiesz, że tekst nie będzie zawierał niektórych znaków, możesz określić dokładnie te tzw. znaki zabronione. Dzięki temu zwiększy się prędkość i dokładność rozpoznawania OCR. Aby określić te znaki, kliknij przycisk Zaawansowane... w oknie dialogowym Właściwości grupy języków i wprowadź znaki zabronione w polu Zabronione znaki.
  5. Kliknij OK.

Nowa grupa języków pojawi się na liście rozwijanej języków na głównym pasku narzędzi.

Domyślnie grupy języków użytkownika są zapisywane w folderze projekcie OCR. Można też zapisać wszystkie języki i wzorce użytkownika w jednym pliku. W tym celuotwórz okno dialogowe Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe), kliknij przycisk OCR, a następnie kliknij przycisk Zapisz wzorce i języki....

Wskazówka. Grupę języków możesz też wybrać z listy rozwijanej języków na głównym pasku narzędzi.

  1. Wybierz Więcej języków... z listy rozwijanej języków na głównym pasku narzędzi.
  2. W polu Edytor języka wybierz opcję Podaj ręcznie języki OCR.
  3. Wybierz języki i kliknij OK.

9/7/2020 8:12:25 PM


Please leave your feedback about this article