Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania OCR

Jakość obrazów ma duży wpływ na jakość rozpoznawania OCR. W tej części opisano, jakie czynniki należy wziąć pod uwagę przed rozpoczęciem rozpoznawania obrazów.

Języki OCR

Program ABBYY FineReader rozpoznaje dokumenty napisane w jednym bądź wielu językach (np. dwóch lub więcej). W przypadku dokumentów wielojęzycznych należy wybrać kilka języków rozpoznawania OCR.

Aby wybrać języki OCR, kliknij Opcje > Języki i wybierz jedną z następujących opcji:

  • Automatycznie wybierz języki OCR z poniższej listy
    Program ABBYY FineReader automatycznie wybierze odpowiednie języki z listy języków zdefiniowanych przez użytkownika. Aby edytować listę języków:
    1. Zaznacz opcję Automatycznie wybierz języki OCR z poniższej listy.
    2. Kliknij przycisk Określ....
    3. W oknie dialogowym Języki wybierz języki i kliknij OK.
    4. Na liście rozwijanej Opcje kliknij przycisk OK.
  • Podaj ręcznie języki OCR
    Wybierz tę opcję, jeśli potrzebnego języka nie ma na liście.

W poniższym oknie dialogowym wskaż jeden lub więcej języków. Jeśli często korzystasz z określonej kombinacji języków, możesz utworzyć nową grupę dla tych języków.

Jeśli języka nie ma na liście, to znaczy, że:

  1. program ABBYY FineReader go nie obsługuje lub
    Listę wszystkich obsługiwanych języków można znaleźć w sekcji Obsługiwane języki OCR.
  2. nie jest obsługiwany przez Twoją wersję produktu.
    Listę wszystkich języków obsługiwanych przez wybraną wersję programu można znaleźć w oknie dialogowym Licencje (kliknij Pomoc > O programie... > Informacje o licencji aby otworzyć to okno dialogowe).

Można nie tylko używać wbudowanych języków i grup języków, ale również tworzyć własne. Zobacz również: Jeśli program nie rozpoznaje niektórych znaków.

Typ druku

Dokumenty mogą być drukowane na różnych urządzeniach, takich jak maszyny do pisania i faks. Sposób druku dokumentu ma znaczenie dla jakości rozpoznawania OCR. Jakość rozpoznawania OCR można poprawić, wybierając odpowiedni typ druku w oknie dialogowym Opcje.

W większości przypadków program automatycznie wykrywa typy druku dokumentu. Aby typ druku był wykrywany automatycznie, musi być zaznaczona opcja Auto w grupie opcji Typ dokumentu w oknie dialogowym Opcje (kliknij Narzędzia > Opcje... > OCR aby uzyskać dostęp do tych opcji). Dokument można przetworzyć w trybie czarno-białym lub kolorowym.

Ponadto w razie potrzeby można też ręcznie wybrać typ druku.

Przykład tekstu napisanego na maszynie. Wszystkie litery mają jednakową szerokość (porównaj na przykład litery „w” i „t”). W przypadku takich tekstów należy wybrać typ Maszyna do pisania.
Przykład tekstu wydrukowanego przez faks. Jak widać w przedstawionym przykładzie, w niektórych miejscach litery są niewyraźne. Widoczne są też kurz i zniekształcenia. W przypadku takich tekstów należy wybrać typ Faks.

Po zakończeniu rozpoznawania tekstów pisanych na maszynie i faksów należy włączyć opcję Auto przed przystąpieniem do przetwarzania zwykłych dokumentów drukowanych.

Jakość druku

Dokumenty o niskiej jakości z „kurzem” (tzn. czarnymi kropkami lub plamkami), rozmazanymi i nierównymi literami lub zakrzywionymi wierszami i przesuniętymi granicami tabel mogą wymagać specjalnych ustawień skanowania.

Faks Gazeta

Dokumenty o niskiej jakości najlepiej skanować w odcieniach szarości. Przy skanowaniu w odcieniach szarości program automatycznie ustawi optymalną jasność.

Tryb skanowania w skali szarości zachowuje więcej informacji na temat liter skanowanego tekstu, co zapewnia lepsze wyniki rozpoznawania OCR podczas rozpoznawania dokumentów średniej lub niskiej jakości. Niektóre usterki można również usunąć ręcznie, korzystając z narzędzi do edycji obrazów, dostępnych w Edytorze obrazów. Zobacz również: Jeżeli obraz dokumentu zawiera defekty i dokładność OCR jest niska.

Tryb kolorowy

Jeśli nie chcesz zachować oryginalnych kolorów kolorowego dokumentu, możesz go przetworzyć w trybie czarno-białym. To znacznie zmniejszy rozmiar projektu OCR i przyspieszy proces rozpoznawania. Jednakże przetwarzanie obrazów o niskim kontraście w trybie czarno-białym może spowodować, że jakość odczytywania OCR będzie niska. Nie zaleca się również stosowania trybu czarno-białego do przetwarzania zdjęć, stron z czasopism oraz tekstów w językach chińskim, japońskim i koreańskim.

Wskazówka. Ponadto szybkość rozpoznawania OCR kolorowych i czarno-białych dokumentów można zwiększyć, wybierając opcję Szybkie rozpoznawanie na zakładce OCR okna dialogowego Opcje. Więcej informacji na temat trybów rozpoznawania można znaleźć w części Opcje OCR.

Więcej zaleceń dotyczących wyboru odpowiedniego trybu kolorów znajduje się w sekcji Wskazówki na temat skanowania.

Po przekonwertowaniu dokumentu na czarno-biały nie będzie można przywrócić pełnych kolorów. Aby otrzymać kolorowy dokument, otwórz plik z kolorowymi obrazami lub zeskanuj papierowy dokument w trybie kolorowym.

17.05.2023 7:35:03

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.