- English (English)
- Bulgarian (Български)
- Chinese Simplified (简体中文)
- Chinese Traditional (繁體中文)
- Czech (Čeština)
- Danish (Dansk)
- Dutch (Nederlands)
- French (Français)
- German (Deutsch)
- Greek (Ελληνικά)
- Hungarian (Magyar)
- Italian (Italiano)
- Japanese (日本語)
- Korean (한국어)
- Portuguese (Brazilian) (Português (Brasil))
- Slovak (Slovenský)
- Spanish (Español)
- Swedish (Svenska)
- Turkish (Türkçe)
- Ukrainian (Українська)
- Vietnamese (Tiếng Việt)
Właściwości dokumentu, które należy uwzględnić przed rozpoczęciem rozpoznawania OCR
Jakość obrazów ma duży wpływ na jakość rozpoznawania OCR. W tej części opisano, jakie czynniki należy wziąć pod uwagę przed rozpoczęciem rozpoznawania obrazów.
Program ABBYY FineReader rozpoznaje dokumenty napisane w jednym bądź wielu językach (np. dwóch lub więcej). W przypadku dokumentów wielojęzycznych należy wybrać kilka języków rozpoznawania OCR.
Aby wybrać języki OCR, kliknij Opcje > Języki i wybierz jedną z następujących opcji:
- Automatycznie wybierz języki OCR z poniższej listy
Program ABBYY FineReader automatycznie wybierze odpowiednie języki z listy języków zdefiniowanych przez użytkownika. Aby edytować listę języków: - Zaznacz opcję Automatycznie wybierz języki OCR z poniższej listy.
- Kliknij przycisk Określ....
- W oknie dialogowym Języki wybierz języki i kliknij OK.
- Na liście rozwijanej Opcje kliknij przycisk OK.
- Podaj ręcznie języki OCR
Wybierz tę opcję, jeśli potrzebnego języka nie ma na liście.
W poniższym oknie dialogowym wskaż jeden lub więcej języków. Jeśli często korzystasz z określonej kombinacji języków, możesz utworzyć nową grupę dla tych języków.
Jeśli języka nie ma na liście, to znaczy, że:
- program ABBYY FineReader go nie obsługuje lub
Listę wszystkich obsługiwanych języków można znaleźć w sekcji Obsługiwane języki OCR. - nie jest obsługiwany przez Twoją wersję produktu.
Listę wszystkich języków obsługiwanych przez wybraną wersję programu można znaleźć w oknie dialogowym Licencje (kliknij Pomoc > O programie... > Informacje o licencji aby otworzyć to okno dialogowe).
Można nie tylko używać wbudowanych języków i grup języków, ale również tworzyć własne. Zobacz również: Jeśli program nie rozpoznaje niektórych znaków.
Dokumenty mogą być drukowane na różnych urządzeniach, takich jak maszyny do pisania i faks. Sposób druku dokumentu ma znaczenie dla jakości rozpoznawania OCR. Jakość rozpoznawania OCR można poprawić, wybierając odpowiedni typ druku w oknie dialogowym Opcje.
W większości przypadków program automatycznie wykrywa typy druku dokumentu. Aby typ druku był wykrywany automatycznie, musi być zaznaczona opcja Auto w grupie opcji Typ dokumentu w oknie dialogowym Opcje (kliknij Narzędzia > Opcje... > OCR aby uzyskać dostęp do tych opcji). Dokument można przetworzyć w trybie czarno-białym lub kolorowym.
Ponadto w razie potrzeby można też ręcznie wybrać typ druku.
Przykład tekstu napisanego na maszynie. Wszystkie litery mają jednakową szerokość (porównaj na przykład litery „w” i „t”). W przypadku takich tekstów należy wybrać typ Maszyna do pisania. | |
Przykład tekstu wydrukowanego przez faks. Jak widać w przedstawionym przykładzie, w niektórych miejscach litery są niewyraźne. Widoczne są też kurz i zniekształcenia. W przypadku takich tekstów należy wybrać typ Faks. |
Po zakończeniu rozpoznawania tekstów pisanych na maszynie i faksów należy włączyć opcję Auto przed przystąpieniem do przetwarzania zwykłych dokumentów drukowanych.
Dokumenty o niskiej jakości z „kurzem” (tzn. czarnymi kropkami lub plamkami), rozmazanymi i nierównymi literami lub zakrzywionymi wierszami i przesuniętymi granicami tabel mogą wymagać specjalnych ustawień skanowania.
Faks | Gazeta |
Dokumenty o niskiej jakości najlepiej skanować w odcieniach szarości. Przy skanowaniu w odcieniach szarości program automatycznie ustawi optymalną jasność.
Tryb skanowania w skali szarości zachowuje więcej informacji na temat liter skanowanego tekstu, co zapewnia lepsze wyniki rozpoznawania OCR podczas rozpoznawania dokumentów średniej lub niskiej jakości. Niektóre usterki można również usunąć ręcznie, korzystając z narzędzi do edycji obrazów, dostępnych w Edytorze obrazów. Zobacz również: Jeżeli obraz dokumentu zawiera defekty i dokładność OCR jest niska.
Jeśli nie chcesz zachować oryginalnych kolorów kolorowego dokumentu, możesz go przetworzyć w trybie czarno-białym. To znacznie zmniejszy rozmiar projektu OCR i przyspieszy proces rozpoznawania. Jednakże przetwarzanie obrazów o niskim kontraście w trybie czarno-białym może spowodować, że jakość odczytywania OCR będzie niska. Nie zaleca się również stosowania trybu czarno-białego do przetwarzania zdjęć, stron z czasopism oraz tekstów w językach chińskim, japońskim i koreańskim.
Wskazówka. Ponadto szybkość rozpoznawania OCR kolorowych i czarno-białych dokumentów można zwiększyć, wybierając opcję Szybkie rozpoznawanie na zakładce OCR okna dialogowego Opcje. Więcej informacji na temat trybów rozpoznawania można znaleźć w części Opcje OCR.
Więcej zaleceń dotyczących wyboru odpowiedniego trybu kolorów znajduje się w sekcji Wskazówki na temat skanowania.
Po przekonwertowaniu dokumentu na czarno-biały nie będzie można przywrócić pełnych kolorów. Aby otrzymać kolorowy dokument, otwórz plik z kolorowymi obrazami lub zeskanuj papierowy dokument w trybie kolorowym.
12.06.2024 14:31:05