Jeśli program nie rozpoznaje niektórych znaków

Program ABBYY FineReader 14 do rozpoznawania tekstu wykorzystuje dane o języku dokumentu. Program może nie rozpoznać niektórych znaków w dokumentach zawierających nieznane elementy (np. liczby kodowe), ponieważ język dokumentu może nie zawierać tych znaków. W celu rozpoznania takich dokumentów można utworzyć niestandardowy język zawierający wszystkie potrzebne znaki. Można również utworzyć grupy kilku języków OCR i korzystać z tych grup podczas rozpoznawania dokumentów.

Jak utworzyć nowy język użytkownika

  1. Otwórz kartę Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe), kliknij przycisk Języki.
  2. Kliknij przycisk Nowy....
  3. W oknie dialogowym, które zostanie otwarte, wybierz opcję Utworzyć nowy język na bazie istniejącego, wybierz język, który posłuży jako baza do utworzenia nowego języka i kliknij OK.
  4. Pasek Właściwości języka. W oknie tym:
    1. Wpisz nazwę nowego języka.
    2. Język, który został wybrany w oknie dialogowym Nowy język lub grupa jest wyświetlony na liście rozwijanej Język źródłowy. Z listy tej można wybrać inny język.
    3. Pasek Alfabet zawiera alfabet języka bazowego. Jeśli chcesz edytować alfabet, kliknij przycisk .
    4. Pasek opcji Słownik zawiera kilka opcji dotyczących słownika, które będą wykorzystywane przez program przy rozpoznawaniu tekstu i sprawdzaniu wyników:
      • Brak
        Brak słownika dla tego języka.
      • Słownik wbudowany
        Zostanie zastosowany wbudowany słownik programu.
      • Słownik użytkownika
        Kliknij przycisk Edytuj..., aby określić terminy słownikowe lub zaimportować istniejący niestandardowy słownik albo plik tekstowy o kodowaniu Windows-1252 (terminy muszą być oddzielone spacjami lub innymi nienależącymi do alfabetu znakami).
        Słowa ze słownika użytkownika nie zostaną oznaczone jako niepoprawne w procesie sprawdzania pisowni rozpoznanego tekstu. Mogą być napisane samymi małymi lub wielkimi literami albo wszystkie zaczynać się wielką literą.
Słowo w słowniku Słowa, które nie zostaną uznane za niepoprawne podczas sprawdzania pisowni
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Pasek Wyrażenie regularne pozwala utworzyć słownik użytkownika z wykorzystaniem wyrażeń regularnych.
    Zobacz również: Wyrażenia regularne.
  1. Języki mogą mieć kilka dodatkowych właściwości. Aby zmienić te właściwości, kliknij przycisk Zaawansowane..., aby otworzyć okno dialogowe Zaawansowane właściwości języka, w którym można określić:
    • Znaki, które mogą znajdować się na początku lub końcu słowa
    • Znaki niebędące literami, które występują oddzielnie od słów
    • Znaki, które mogą występować w środku słowa, lecz powinny być ignorowane
    • Znaki, które nie mogą występować w tekście rozpoznawanym przy użyciu tego języka (znaki zabronione)
    • Pasek Tekst może zawierać liczebniki arabskie, liczebniki rzymskie i skróty Opcja
  2. Teraz podczas wybierania języków OCR można wybrać nowo utworzony język.
    Więcej informacji na temat języków OCR — zob. Języki OCR.

Domyślnie języki użytkownika są zapisywane w folderze projektu OCR. Można też zapisać wszystkie języki i wzorce użytkownika w jednym pliku. W tym celuotwórz okno dialogowe Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe), kliknij przycisk OCR, a następnie kliknij przycisk Zapisz wzorce i języki....

Tworzenie grupy języków

Jeśli zamierzasz regularnie używać pewnej kombinacji języków, możesz rozważyć pogrupowanie języków dla wygody.

  1. Otwórz kartę Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe) i kliknij kartę Języki.
  2. Kliknij przycisk Nowy....
  3. W polu Nowy język lub grupa wybierz opcję Utworzyć nową grupę języków i kliknij OK.
  4. Zostanie otwarte okno dialogowe Właściwości grupy języków. W oknie tym podaj nazwę grupy języków i wybierz języki, które chcesz w niej umieścić.
    Jeśli wiesz, że tekst nie będzie zawierał niektórych znaków, możesz określić dokładnie te tzw. znaki zabronione. Dzięki temu zwiększy się prędkość i dokładność rozpoznawania OCR. Aby określić te znaki, kliknij przycisk Zaawansowane... w oknie dialogowym Właściwości grupy języków i wprowadź znaki zabronione w polu Zabronione znaki.
  5. Kliknij OK.

Nowa grupa języków pojawi się na liście rozwijanej języków na głównym pasku narzędzi.

Domyślnie grupy języków użytkownika są zapisywane w folderze projekcie OCR. Można też zapisać wszystkie języki i wzorce użytkownika w jednym pliku. W tym celuotwórz okno dialogowe Opcje (kliknij Narzędzia > Opcje..., aby otworzyć to okno dialogowe), kliknij przycisk OCR, a następnie kliknij przycisk Zapisz wzorce i języki....

Wskazówka. Grupę języków możesz też wybrać z listy rozwijanej języków na głównym pasku narzędzi.

  1. Wybierz Więcej języków... z listy rozwijanej języków na głównym pasku narzędzi.
  2. W polu Edytor języka wybierz opcję Podaj ręcznie języki OCR.
  3. Wybierz języki i kliknij OK.

02.11.2018 16:19:46

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.