Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania

Jakość obrazów ma duży wpływ na jakość rozpoznawania. W tej części opisano, jakie czynniki należy wziąć pod uwagę przed rozpoczęciem rozpoznawania obrazów:

Języki dokumentu

Program ABBYY FineReader rozpoznaje dokumenty napisane w jednym bądź wielu językach (np. dwóch lub więcej). W przypadku dokumentów wielojęzycznych należy wybrać kilka języków rozpoznawania.

Aby określić język OCR dla dokumentu, z listy Język dokumentu na głównym pasku narzędzi lub w oknie Zadanie należy wybrać jedną z poniższych opcji:

  • Automatyczny wybór

Program ABBYY FineReader automatycznie wybierze odpowiednie języki z listy języków zdefiniowanych przez użytkownika. Aby zmienić tę listę:

  1. Wybierz opcję Więcej języków….
  2. W oknie dialogowym Edytor języka zaznacz opcję Automatycznie wybierz język dokumentu z poniższej listy.
  3. Kliknij przycisk Określ….
  4. W oknie dialogowym Języki wybierz odpowiednie języki.
  • Język lub połączenie języków

Wybierz język lub połączenie języków. Lista języków zawiera ostatnio używane języki rozpoznawania, a także angielski, niemiecki i francuski.

  • Więcej języków…

Wybierz tę opcję, jeśli język nie jest wyświetlany na liście.

W oknie dialogowym Edytor języka wybierz opcję Wybierz języki ręcznie, a następnie język lub języki, zaznaczając znajdujące się obok nich pola wyboru. Jeśli dane połączenie języków jest często używane, można dla nich utworzyć nową grupę.

Jeśli języka nie ma na liście:

  1. nie jest obsługiwany przez program ABBYY FineReader.

Pełną listę obsługiwanych języków można znaleźć w części „Obsługiwane języki”.

  1. nie jest obsługiwany przez Twoją wersję programu.

Lista wszystkich języków obsługiwanych przez Twój program znajduje się w oknie dialogowym Licencje (Pomoc > O programie… > Informacje o licencji).

Można nie tylko używać wbudowanych języków i grup języków, ale również tworzyć własne. Szczegółowe informacje znajdują się w części „Jeśli program nie rozpoznaje niektórych znaków”.

Typ druku

Dokumenty mogą być drukowane na różnych urządzeniach, takich jak maszyny do pisania i faks. Jakość rozpoznawania można poprawić, wybierając odpowiedni Typ dokumentu w oknie dialogowym Opcje.

W przypadku większości dokumentów program wykryje typ wydruku automatycznie. Aby program automatycznie wykrywał typ wydruku, w oknie dialogowym Opcje (Narzędzia > Opcje…) w obszarze Typ dokumentu musi być zaznaczona opcja Auto. Dokument można przetworzyć w trybie czarno-białym lub kolorowym.

W razie potrzeby można także wybrać typ wydruku ręcznie.

Przykład wydruku z maszyny do pisania. Wszystkie litery mają jednakową szerokość (porównaj na przykład litery „w” oraz „t”).  W przypadku takich tekstów należy wybrać typ Maszyna do pisania.
Przykład tekstu wydrukowanego z faksu. Jak widać na tym przykładzie, w niektórych miejscach litery są niewyraźne. Poza tym występuje szum i zniekształcenia. W przypadku takich tekstów należy wybrać typ Faks.

Podpowiedź: pamiętaj, aby po zakończeniu rozpoznawania tekstów z maszyny do pisania zaznaczyć opcję Auto, zanim przetwarzane będą zwykłe dokumenty drukowane.

Jakość druku

Dokumenty o niskiej jakości z „kurzem” (tzn. czarnymi kropkami lub plamkami), rozmazanymi i nierównymi literami lub zakrzywionymi wierszami i przesuniętymi granicami tabel mogą wymagać specjalnych ustawień skanowania.

Faks Gazeta

Dokumenty o niskiej jakości najlepiej jest skanować w odcieniach szarości. Przy skanowaniu w odcieniach szarości program automatycznie ustawi optymalną jasność.

Tryb skanowania w skali szarości zachowuje więcej informacji na temat liter skanowanego tekstu, co zapewnia lepsze wyniki rozpoznawania OCR podczas rozpoznawania dokumentów średniej lub niskiej jakości. Niektóre usterki można również usunąć ręcznie, korzystając z narzędzi do edycji obrazów, dostępnych w Edytorze obrazów. Szczegółowe informacje znajdują się w części „Wstępne przetwarzanie obrazów”.

Tryb kolorów

Jeśli nie ma potrzeby zachowania oryginalnych kolorów kolorowego dokumentu, można go przetworzyć w trybie czarno-białym. To znacznie zmniejszy rozmiar dokumentu ABBYY FineReader i przyspieszy proces rozpoznawania OCR. Tym niemniej przetwarzanie obrazów o niskim kontraście w trybie czarno-białym może spowodować, że jakość rozpoznawania OCR będzie niska. Nie zaleca się również stosowania trybu czarno-białego do przetwarzania zdjęć, stron z czasopism oraz tekstów w językach chińskim, japońskim i koreańskim.

Uwaga: Szybkość rozpoznawania dokumentów kolorowych i czarno-białych można także przyspieszyć, korzystając z opcji Szybkie czytanie dostępnej na karcie Rozpoznane w oknie dialogowym Opcje. Więcej informacji na temat trybów rozpoznawania można znaleźć w części Opcje OCR.

Wybieranie trybu kolorów:

  • Skorzystaj z listy rozwijanej Tryb koloru w oknie dialogowym Zadanie lub
  • użyj jednej z opcji dostępnych w obszarze Tryb koloru na karcie Dokument w oknie dialogowym Opcje (Narzędzia> Opcje…).

Ważne! Po przekonwertowaniu dokumentu na czarno-biały nie będzie można przywrócić pełnych kolorów. Aby otrzymać dokument kolorowy, otwórz plik z kolorowymi obrazami lub zeskanuj papierowy dokument w trybie kolorowym.

1/14/2020 5:26:20 PM


Please leave your feedback about this article