- English (English)
- Bulgarian (Български)
- Chinese Simplified (简体中文)
- Chinese Traditional (繁體中文)
- Czech (Čeština)
- Danish (Dansk)
- Dutch (Nederlands)
- Estonian (Eesti)
- French (Français)
- German (Deutsch)
- Greek (Ελληνικά)
- Hungarian (Magyar)
- Italian (Italiano)
- Japanese (日本語)
- Korean (한국어)
- Portuguese (Brazilian) (Português (Brasil))
- Slovak (Slovenský)
- Spanish (Español)
- Swedish (Svenska)
- Turkish (Türkçe)
- Ukrainian (Українська)
- Vietnamese (Tiếng Việt)
Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania
Jakość obrazów ma duży wpływ na jakość rozpoznawania. W tej części opisano, jakie czynniki należy wziąć pod uwagę przed rozpoczęciem rozpoznawania obrazów:
Języki dokumentu
Program ABBYY FineReader rozpoznaje dokumenty napisane w jednym bądź wielu językach (np. dwóch lub więcej). W przypadku dokumentów wielojęzycznych należy wybrać kilka języków rozpoznawania.
Aby określić język OCR dla dokumentu, z listy Język dokumentu na głównym pasku narzędzi lub w oknie Zadanie należy wybrać jedną z poniższych opcji:
- Automatyczny wybór
Program ABBYY FineReader automatycznie wybierze odpowiednie języki z listy języków zdefiniowanych przez użytkownika. Aby zmienić tę listę:
- Wybierz opcję Więcej języków….
- W oknie dialogowym Edytor języka zaznacz opcję Automatycznie wybierz język dokumentu z poniższej listy.
- Kliknij przycisk Określ….
- W oknie dialogowym Języki wybierz odpowiednie języki.
- Język lub połączenie języków
Wybierz język lub połączenie języków. Lista języków zawiera ostatnio używane języki rozpoznawania, a także angielski, niemiecki i francuski.
- Więcej języków…
Wybierz tę opcję, jeśli język nie jest wyświetlany na liście.
W oknie dialogowym Edytor języka wybierz opcję Wybierz języki ręcznie, a następnie język lub języki, zaznaczając znajdujące się obok nich pola wyboru. Jeśli dane połączenie języków jest często używane, można dla nich utworzyć nową grupę.
Jeśli języka nie ma na liście:
- nie jest obsługiwany przez program ABBYY FineReader.
Pełną listę obsługiwanych języków można znaleźć w części „Obsługiwane języki”.
- nie jest obsługiwany przez Twoją wersję programu.
Lista wszystkich języków obsługiwanych przez Twój program znajduje się w oknie dialogowym Licencje (Pomoc > O programie… > Informacje o licencji).
Można nie tylko używać wbudowanych języków i grup języków, ale również tworzyć własne. Szczegółowe informacje znajdują się w części „Jeśli program nie rozpoznaje niektórych znaków”.
Typ druku
Dokumenty mogą być drukowane na różnych urządzeniach, takich jak maszyny do pisania i faks. Jakość rozpoznawania można poprawić, wybierając odpowiedni Typ dokumentu w oknie dialogowym Opcje.
W przypadku większości dokumentów program wykryje typ wydruku automatycznie. Aby program automatycznie wykrywał typ wydruku, w oknie dialogowym Opcje (Narzędzia > Opcje…) w obszarze Typ dokumentu musi być zaznaczona opcja Auto. Dokument można przetworzyć w trybie czarno-białym lub kolorowym.
W razie potrzeby można także wybrać typ wydruku ręcznie.
Przykład wydruku z maszyny do pisania. Wszystkie litery mają jednakową szerokość (porównaj na przykład litery „w” oraz „t”). W przypadku takich tekstów należy wybrać typ Maszyna do pisania. | |
Przykład tekstu wydrukowanego z faksu. Jak widać na tym przykładzie, w niektórych miejscach litery są niewyraźne. Poza tym występuje szum i zniekształcenia. W przypadku takich tekstów należy wybrać typ Faks. |
Podpowiedź: pamiętaj, aby po zakończeniu rozpoznawania tekstów z maszyny do pisania zaznaczyć opcję Auto, zanim przetwarzane będą zwykłe dokumenty drukowane.
Jakość druku
Dokumenty o niskiej jakości z „kurzem” (tzn. czarnymi kropkami lub plamkami), rozmazanymi i nierównymi literami lub zakrzywionymi wierszami i przesuniętymi granicami tabel mogą wymagać specjalnych ustawień skanowania.
Faks | Gazeta |
Dokumenty o niskiej jakości najlepiej jest skanować w odcieniach szarości. Przy skanowaniu w odcieniach szarości program automatycznie ustawi optymalną jasność.
Tryb skanowania w skali szarości zachowuje więcej informacji na temat liter skanowanego tekstu, co zapewnia lepsze wyniki rozpoznawania OCR podczas rozpoznawania dokumentów średniej lub niskiej jakości. Niektóre usterki można również usunąć ręcznie, korzystając z narzędzi do edycji obrazów, dostępnych w Edytorze obrazów. Szczegółowe informacje znajdują się w części „Wstępne przetwarzanie obrazów”.
Tryb kolorów
Jeśli nie ma potrzeby zachowania oryginalnych kolorów kolorowego dokumentu, można go przetworzyć w trybie czarno-białym. To znacznie zmniejszy rozmiar dokumentu ABBYY FineReader i przyspieszy proces rozpoznawania OCR. Tym niemniej przetwarzanie obrazów o niskim kontraście w trybie czarno-białym może spowodować, że jakość rozpoznawania OCR będzie niska. Nie zaleca się również stosowania trybu czarno-białego do przetwarzania zdjęć, stron z czasopism oraz tekstów w językach chińskim, japońskim i koreańskim.
Uwaga: Szybkość rozpoznawania dokumentów kolorowych i czarno-białych można także przyspieszyć, korzystając z opcji Szybkie czytanie dostępnej na karcie Rozpoznane w oknie dialogowym Opcje. Więcej informacji na temat trybów rozpoznawania można znaleźć w części Opcje OCR.
Wybieranie trybu kolorów:
- Skorzystaj z listy rozwijanej Tryb koloru w oknie dialogowym Zadanie lub
- użyj jednej z opcji dostępnych w obszarze Tryb koloru na karcie Dokument w oknie dialogowym Opcje (Narzędzia> Opcje…).
Ważne! Po przekonwertowaniu dokumentu na czarno-biały nie będzie można przywrócić pełnych kolorów. Aby otrzymać dokument kolorowy, otwórz plik z kolorowymi obrazami lub zeskanuj papierowy dokument w trybie kolorowym.
14.01.2020 17:26:20