タブ: 設定

詳しい分析

ABBYY FineReader Server 14では、文書メタデータの高速分析がデフォルトで有効になっています。この分析タイプを使って取得されるページ数情報は、概数に過ぎません:

  • 全ファイルからページ情報を抽出することはできません。
    例えば、テーブルファイル(XLS、XLSX、ODS)はページに分かれていません。
  • 入力ファイルにA4以上のサイズのページが含まれる場合には、処理中にページ数が増加する場合があります。
  • 良好なテキストレイヤーのあるPDFファイルに、テキストのないページが含まれる場合には、ほとんどの場合再認識が必要となります。

こちらも参照してください:ライセンスによるページ制限数の管理

正確なページ数を取得するには、監査ワークフローの設定ダイアログボックスの設定タブを開いて、詳しい分析を選んでください。この分析タイプは、FineReader Server 14 R3 Update 2以降で利用できます。

詳しい分析では、文書の分析にABBYYの光学式文字認識技術が使用されます。これで、最高の精度で処理するために必要となるページ数が計算されます。

注:詳しい分析を使用すると、文書の処理は著しく遅くなります。

詳しい分析と正規表現検索のための入力ファイルフィルターを設定することができます。それには、監査ワークフローの設定ダイアログの設定タブを開いて編集とフィルタ...をクリックします。入力フィルターを使えば、処理する文書の数を減らすことができるので、分析速度が改善されます。

注:文書のメタデータを分析する時(デフォルトで有効)および追加のレポート作成時には、フィルターは使われません。

追加レポート

監査ワークフロー設定で、特定のファイルカテゴリに対して作成する追加のレポートを指定できます:

  • 指定されたサイズ制限以上のファイル(メガバイト単位)。
    システムの速度が落ち、その他のタスクを遅延させるため、大きなファイルの処理が好ましくない場合もあります。このレポートはどの程度大きなファイルを別途処理するか決定するのに使用できます。
  • 指定された日付以前に最終変更が行われたファイル。
    このレポートは、処理を後回しにできる古くなったファイルの割合を判断できるようにします。
  • 重複ファイル。
    このレポートにはストレージで見つかった重複するファイル、そのサイズとロケーションのリストが含まれます。ストレージを最適化し、実際に処理が必要なファイルのみを処理できるようにします。

注:重複検索を有効にすると監査ワークフローが大幅に遅くなります。

注:SharePointライブラリにカスタム列がある場合には、重複検索はDOC、DOCX、XLS、XLSX、PPT、PPTX形式のドキュメントでは機能しません。Microsoft SharePointはこの形式のファイルにカスタムプロパティを追加して変更するためです。

26.03.2024 13:49:51

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.