Karmaşık yazımlı dillerle çalışma

ABBYY FineReader'ı kullanarak, İbranice, Eski İbranice, Japonca, Çince, Tayca, Korece ve Arapça dillerindeki belgeleri de tanıyabilirsiniz. Çince, Japonca veya Korece (CJK) hazırlanmış belgelerle ve CJK / Avrupa dilleri kombinasyonu kullanılarak hazırlanmış belgelerle çalışırken dikkate almanız gereken bazı hususlar vardır.

Önerilen yazı tipleri

Arapça, İbranice, Eski İbranice, Tayca, Çince, Japonca ve Korece metinlerin tanınabilmesi için ek yazı tipleri yüklemek gerekebilir. Aşağıdaki tablo, bu dillerdeki metinler için önerilen yazı tiplerini listeler.

OCR dilleri Önerilen yazı tipi
Arapça Arial™ Unicode™ MS
İbranice Arial™ Unicode™ MS
Eski İbranice Arial™ Unicode™ MS
Tayca

Arial™ Unicode™ MS

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Çince (Basitleştirilmiş)

Çince (Geleneksel)

Japonca, Korece

Korece (Hangul)

Arial™ Unicode™ MS

SimSun yazı tipleri Örneğin:

Örnek SimSun (Founder Extended),

SimSun-18030, NSimSun.

Simhei

YouYuan

PMingLiU

MingLiU

Ming (ISO10646 için)

STSong

Aşağıdaki bölümler, tanıma doğruluğunu geliştirmeye yönelik ipuçları içerirler.

Otomatik görüntü işlemeyi devre dışı bırakma

Bir OCR projesi ne eklediğiniz sayfalar varsayılan olarak tanınır.

Ancak belgeniz hem CJK dillerinden birinden hem de bir Avrupa dilinden oluşan bir metin içeriyorsa, otomatik sayfa yönlendirme algılamasını devre dışı bırakmanızı ve sadece tüm sayfa görüntüleri doğru yönlendirmeye sahipse (örn. baş aşağı taranmamışlarsa) ikili sayfaları bölme seçeneğini kullanmanızı öneririz.

Seçenekler iletişim kutusunun Görüntü işlem sekmesindeki Sayfa yönlendirmesini düzelt ve Yan yana sayfaları böl (bu iletişim kutusunu açmak için Araçlar > Seçenekler... öğelerine tıklayın).

Arapça, İbranice veya Eski İbranice dillerindeki yan yana sayfaları ayırmak için önce ilgili OCR dilini seçtiğinizden emin olun ve ancak bundan sonra Yan yana sayfaları böl seçimini yapın. Ayrıca Kitap sayfalarını değiştir seçimi ile orijinal sayfa numaralandırmasını geri getirebilirsiniz. Ayrıca bakınız: OCR projeleri.

If your document has a complex structure, we recommend disabling automatic analysis and OCR for images and performing these operations manually.

Seçenekler iletişim kutusunun Görüntü işlem sekmesinden yeni eklenen görüntülerde otomatik olarak analiz ve OCR işlemi yapılmasını kapatabilirsiniz iletişim kutusundan seçilebilen bir dizi seçenektir (bu iletişim kutusunu açmak için Araçlar > Seçenekler... öğelerine tıklayın).

  1. Araçlar > Seçenekler... üzerine tıklayarak Seçenekler iletişim kutusunu açın.
  2. Üzerine tıklayın. Görüntü işlem tab, clear the OCR Editörüne eklenen sayfa görüntülerini otomatik olarak işle seçimini yapın.
  3. Tamam.

Birden fazla dilde yazılmış belgeleri tanıma

Aşağıdaki talimatlar bir örnek olarak sunulmuştur ve hem İngilizce hem de Çince metin içeren bir belgede nasıl tanıma yapılacağını anlatır. Diğer dilleri içeren belgelerde de benzer şekilde tanıma yapılabilir.

  1. Ana araç çubuğundaki diller listesinden Daha fazla dil... seçimini yapın. Dil Editörü iletişim kutusundan OCR dillerini manuel olarak belirtin seçimini yapın ve diller listesinden İngilizce ve Çinceyi seçin.
  2. Sayfalarınızı tarayın veya sayfa görüntülerinizi açın.
  3. Program bir görüntüdeki alanların tamamını algılayamıyorsa:

Avrupalı olmayan karakterler Metin bölmesinde görüntülenmiyorsa

CJK dillerinden birindeki metinMetin bölmesinde yanlış görüntüleniyorsa Düz metin mod seçimini yanlış yapmış olabilirsiniz.

Düz metin modunda kullanılan yazı tipini değiştirmek için:

  1. Araçlar > Seçenekler... üzerine tıklayarakpen Seçenekler iletişim kutusunu açın.
  2. Alanlar ve Metin sekmesine tıklayın.
  3. Düz metni görüntülemek için kullanılan yazı tipi Açılır listeden Arial Unicode MS seçimini yapın.
  4. Tamam.

Bu işe yaramazsa ve Metin penceresindeki metin yanlış görüntülenmeye devam ederse bkz. Yanlış bir yazı tipi kullanıldıysa veya bazı karakterler "?" ya da "□" ile değiştirildiyse.

Tanınan metnin yönünü değiştirme

ABBYY FineReader metin yönünü otomatik olarak algılar, ancak siz de metin yönünü manuel olarak belirtebilirsiniz.

  1. Metin bölmesini etkinleştirin.
  2. Bir veya birkaç paragraf seçin.
  3. Metin bölmesindeki araç çubuğundan düğmesine tıklayın.

OCR işlemi öncesinde metnin yönünü belirtmek için Görüntü bölmesindeki CJK metninin yönü açılır listeyi kullanabilirsiniz. Ayrıca bakınız: Alan özelliklerini düzenleme.

02.11.2018 16:20:00


Please leave your feedback about this article