Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania OCR

Jakość obrazów ma duży wpływ na jakość rozpoznawania OCR. W tej części opisano, jakie czynniki należy wziąć pod uwagę przed rozpoczęciem rozpoznawania obrazów.

Języki OCR

Program ABBYY FineReader rozpoznaje dokumenty napisane w jednym bądź wielu językach (np. dwóch lub więcej). W przypadku dokumentów wielojęzycznych należy wybrać kilka języków rozpoznawania OCR.

Aby wybrać języki OCR, kliknij Opcje > Języki i wybierz jedną z następujących opcji:

  • Automatycznie wybierz języki OCR z poniższej listy
    Program ABBYY FineReader automatycznie wybierze odpowiednie języki z listy języków zdefiniowanych przez użytkownika. Aby edytować listę języków:
    1. Zaznacz opcję Automatycznie wybierz języki OCR z poniższej listy.
    2. Kliknij przycisk Określ....
    3. W oknie dialogowym Języki wybierz języki i kliknij OK.
    4. Na liście rozwijanej Opcje kliknij przycisk OK.
  • Podaj ręcznie języki OCR
    Wybierz tę opcję, jeśli potrzebnego języka nie ma na liście.

W poniższym oknie dialogowym wskaż jeden lub więcej języków. Jeśli często korzystasz z określonej kombinacji języków, możesz utworzyć nową grupę dla tych języków.

Jeśli języka nie ma na liście, to znaczy, że:

  1. program ABBYY FineReader go nie obsługuje lub
    Listę wszystkich obsługiwanych języków można znaleźć w sekcji Obsługiwane języki OCR.
  2. nie jest obsługiwany przez Twoją wersję produktu.
    Listę wszystkich języków obsługiwanych przez wybraną wersję programu można znaleźć w oknie dialogowym Licencje (kliknij Pomoc > O programie... > Informacje o licencji aby otworzyć to okno dialogowe).

Można nie tylko używać wbudowanych języków i grup języków, ale również tworzyć własne. Zobacz również: Jeśli program nie rozpoznaje niektórych znaków.

Typ druku

Dokumenty mogą być drukowane na różnych urządzeniach, takich jak maszyny do pisania i faks. Sposób druku dokumentu ma znaczenie dla jakości rozpoznawania OCR. Jakość rozpoznawania OCR można poprawić, wybierając odpowiedni typ druku w oknie dialogowym Opcje.

W większości przypadków program automatycznie wykrywa typy druku dokumentu. Aby typ druku był wykrywany automatycznie, musi być zaznaczona opcja Auto w grupie opcji Typ dokumentu w oknie dialogowym Opcje (kliknij Narzędzia > Opcje... > OCR aby uzyskać dostęp do tych opcji). Dokument można przetworzyć w trybie czarno-białym lub kolorowym.

Ponadto w razie potrzeby można też ręcznie wybrać typ druku.

Przykład tekstu napisanego na maszynie. Wszystkie litery mają jednakową szerokość (porównaj na przykład litery „w” i „t”). W przypadku takich tekstów należy wybrać typ Maszyna do pisania.
Przykład tekstu wydrukowanego przez faks. Jak widać w przedstawionym przykładzie, w niektórych miejscach litery są niewyraźne. Widoczne są też kurz i zniekształcenia. W przypadku takich tekstów należy wybrać typ Faks.

Po zakończeniu rozpoznawania tekstów pisanych na maszynie i faksów należy włączyć opcję Auto przed przystąpieniem do przetwarzania zwykłych dokumentów drukowanych.

Jakość druku

Dokumenty o niskiej jakości z „kurzem” (tzn. czarnymi kropkami lub plamkami), rozmazanymi i nierównymi literami lub zakrzywionymi wierszami i przesuniętymi granicami tabel mogą wymagać specjalnych ustawień skanowania.

Faks Gazeta

Dokumenty o niskiej jakości najlepiej skanować w odcieniach szarości. Przy skanowaniu w odcieniach szarości program automatycznie ustawi optymalną jasność.

Tryb skanowania w skali szarości zachowuje więcej informacji na temat liter skanowanego tekstu, co zapewnia lepsze wyniki rozpoznawania OCR podczas rozpoznawania dokumentów średniej lub niskiej jakości. Niektóre usterki można również usunąć ręcznie, korzystając z narzędzi do edycji obrazów, dostępnych w Edytorze obrazów. Zobacz również: Jeżeli obraz dokumentu zawiera defekty i dokładność OCR jest niska.

Tryb kolorowy

Jeśli nie chcesz zachować oryginalnych kolorów kolorowego dokumentu, możesz go przetworzyć w trybie czarno-białym. To znacznie zmniejszy rozmiar projektu OCR i przyspieszy proces rozpoznawania. Jednakże przetwarzanie obrazów o niskim kontraście w trybie czarno-białym może spowodować, że jakość odczytywania OCR będzie niska. Nie zaleca się również stosowania trybu czarno-białego do przetwarzania zdjęć, stron z czasopism oraz tekstów w językach chińskim, japońskim i koreańskim.

Wskazówka. Ponadto szybkość rozpoznawania OCR kolorowych i czarno-białych dokumentów można zwiększyć, wybierając opcję Szybkie rozpoznawanie na zakładce OCR okna dialogowego Opcje. Więcej informacji na temat trybów rozpoznawania można znaleźć w części Opcje OCR.

Więcej zaleceń dotyczących wyboru odpowiedniego trybu kolorów znajduje się w sekcji Wskazówki na temat skanowania.

Po przekonwertowaniu dokumentu na czarno-biały nie będzie można przywrócić pełnych kolorów. Aby otrzymać kolorowy dokument, otwórz plik z kolorowymi obrazami lub zeskanuj papierowy dokument w trybie kolorowym.

11/2/2018 4:19:46 PM


Please leave your feedback about this article