Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania

Jakość obrazów ma duży wpływ na jakość rozpoznawania. W tej części opisano, jakie czynniki należy wziąć pod uwagę przed rozpoczęciem rozpoznawania obrazów:

Języki dokumentu

Program ABBYY FineReader rozpoznaje dokumenty napisane w jednym bądź wielu językach (np. dwóch lub więcej). W przypadku dokumentów wielojęzycznych należy wybrać kilka języków rozpoznawania.

Aby określić język OCR dla dokumentu, z listy Język dokumentu na głównym pasku narzędzi lub w oknie Zadanie należy wybrać jedną z poniższych opcji:

  • Automatyczny wybór

Program ABBYY FineReader automatycznie wybierze odpowiednie języki z listy języków zdefiniowanych przez użytkownika. Aby zmienić tę listę:

  1. Wybierz opcję Więcej języków….
  2. W oknie dialogowym Edytor języka zaznacz opcję Automatycznie wybierz język dokumentu z poniższej listy.
  3. Kliknij przycisk Określ….
  4. W oknie dialogowym Języki wybierz odpowiednie języki.
  • Język lub połączenie języków

Wybierz język lub połączenie języków. Lista języków zawiera ostatnio używane języki rozpoznawania, a także angielski, niemiecki i francuski.

  • Więcej języków…

Wybierz tę opcję, jeśli język nie jest wyświetlany na liście.

W oknie dialogowym Edytor języka wybierz opcję Wybierz języki ręcznie, a następnie język lub języki, zaznaczając znajdujące się obok nich pola wyboru. Jeśli dane połączenie języków jest często używane, można dla nich utworzyć nową grupę.

Jeśli języka nie ma na liście:

  1. nie jest obsługiwany przez program ABBYY FineReader.

Pełną listę obsługiwanych języków można znaleźć w części „Obsługiwane języki”.

  1. nie jest obsługiwany przez Twoją wersję programu.

Lista wszystkich języków obsługiwanych przez Twój program znajduje się w oknie dialogowym Licencje (Pomoc > O programie… > Informacje o licencji).

Można nie tylko używać wbudowanych języków i grup języków, ale również tworzyć własne. Szczegółowe informacje znajdują się w części „Jeśli program nie rozpoznaje niektórych znaków”.

Typ druku

Dokumenty mogą być drukowane na różnych urządzeniach, takich jak maszyny do pisania i faks. Jakość rozpoznawania można poprawić, wybierając odpowiedni Typ dokumentu w oknie dialogowym Opcje.

W przypadku większości dokumentów program wykryje typ wydruku automatycznie. Aby program automatycznie wykrywał typ wydruku, w oknie dialogowym Opcje (Narzędzia > Opcje…) w obszarze Typ dokumentu musi być zaznaczona opcja Auto. Dokument można przetworzyć w trybie czarno-białym lub kolorowym.

W razie potrzeby można także wybrać typ wydruku ręcznie.

Przykład wydruku z maszyny do pisania. Wszystkie litery mają jednakową szerokość (porównaj na przykład litery „w” oraz „t”).  W przypadku takich tekstów należy wybrać typ Maszyna do pisania.
Przykład tekstu wydrukowanego z faksu. Jak widać na tym przykładzie, w niektórych miejscach litery są niewyraźne. Poza tym występuje szum i zniekształcenia. W przypadku takich tekstów należy wybrać typ Faks.

Podpowiedź: pamiętaj, aby po zakończeniu rozpoznawania tekstów z maszyny do pisania zaznaczyć opcję Auto, zanim przetwarzane będą zwykłe dokumenty drukowane.

Jakość druku

Dokumenty o niskiej jakości z „kurzem” (tzn. czarnymi kropkami lub plamkami), rozmazanymi i nierównymi literami lub zakrzywionymi wierszami i przesuniętymi granicami tabel mogą wymagać specjalnych ustawień skanowania.

Faks Gazeta

Dokumenty o niskiej jakości najlepiej jest skanować w odcieniach szarości. Przy skanowaniu w odcieniach szarości program automatycznie ustawi optymalną jasność.

Tryb skanowania w skali szarości zachowuje więcej informacji na temat liter skanowanego tekstu, co zapewnia lepsze wyniki rozpoznawania OCR podczas rozpoznawania dokumentów średniej lub niskiej jakości. Niektóre usterki można również usunąć ręcznie, korzystając z narzędzi do edycji obrazów, dostępnych w Edytorze obrazów. Szczegółowe informacje znajdują się w części „Wstępne przetwarzanie obrazów”.

Tryb kolorów

Jeśli nie ma potrzeby zachowania oryginalnych kolorów kolorowego dokumentu, można go przetworzyć w trybie czarno-białym. To znacznie zmniejszy rozmiar dokumentu ABBYY FineReader i przyspieszy proces rozpoznawania OCR. Tym niemniej przetwarzanie obrazów o niskim kontraście w trybie czarno-białym może spowodować, że jakość rozpoznawania OCR będzie niska. Nie zaleca się również stosowania trybu czarno-białego do przetwarzania zdjęć, stron z czasopism oraz tekstów w językach chińskim, japońskim i koreańskim.

Uwaga: Szybkość rozpoznawania dokumentów kolorowych i czarno-białych można także przyspieszyć, korzystając z opcji Szybkie czytanie dostępnej na karcie Rozpoznane w oknie dialogowym Opcje. Więcej informacji na temat trybów rozpoznawania można znaleźć w części Opcje OCR.

Wybieranie trybu kolorów:

  • Skorzystaj z listy rozwijanej Tryb koloru w oknie dialogowym Zadanie lub
  • użyj jednej z opcji dostępnych w obszarze Tryb koloru na karcie Dokument w oknie dialogowym Opcje (Narzędzia> Opcje…).

Ważne! Po przekonwertowaniu dokumentu na czarno-biały nie będzie można przywrócić pełnych kolorów. Aby otrzymać dokument kolorowy, otwórz plik z kolorowymi obrazami lub zeskanuj papierowy dokument w trybie kolorowym.

14.01.2020 17:26:20

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.