Office ファイルの処理方法
ABBYY FineReader Server では Office ファイル(DOC, DOCX, XLS, XLSX, PPT, PPTX等)を同一のワークフローで画像ファイルとして処理できます。
ABBYY FineReader Server での Office ファイルの処理
デフォルトでは、Office ドキュメントは Officeファイル形式サポートコンポーネントによって処理されます。このコンポーネントは、処理ステーションコンポーネントとともにインストールされます。
Office ファイルはまた、画像ファイルに変換するスクリプトや API を使って ABBYY FineReader Server で処理することもできます。
MS Office または LibreOffice を使った Office ファイルの処理
最善の結果を得るには、ABBYY FineReader Server と同じコンピュータにインストールされているサードパーティのアプリケーションを使って Office ドキュメントを処理してください。ABBYY FineReader Server は、Microsoft Office 2013 以降および LibreOffice 4 以降との統合をサポートしています。
注:ABBYY FineReader Server と適切に統合するには、システムディスクの LibreOffice インストーラが使用するデフォルトフォルダに LibreOffice をインストールしてください。
注:場合によっては、特定のバージョンの LibreOffice に関する問題のために Office ドキュメントの変換が失敗することがあります(詳細は、ABBYY ナレッジベースを参照してください)。
処理設定
ABBYY FineReader Server での Office ドキュメントの処理設定をするには、以下の手順を完了させてください:
- 1つまたは複数の処理ステーションに対して、前処理または処理および前処理の役割を選択します。その役割で処理ステーションを実行しているコンピュータに、Microsoft Office または LibreOffice をインストールする必要があります。
- ワークフローのプロパティダイアログボックスの2. プロセスタブを開きます。Office ドキュメント処理モードドロップダウンリストで、Office ドキュメントを開くための MS Office または LibreOffice プログラムを選択します。
- プログラムが実行されるユーザー(ログインとパスワード)アカウントの認証情報を指定します。
- FineReader Server 処理ステーションサービスがローカルシステムアカウントで実行されており、Microsoft Office 2013、2016 または 2019 を使用する場合は、ユーザーアカウントのログインとパスワードを指定します。
- FineReader Server 処理ステーションサービスがユーザーアカウントで実行され、Microsoft Office 2013 を使用する場合は、ログインとパスワードは必要ありません。
- FineReader Server 処理ステーションサービスがユーザーアカウントで実行され、Microsoft Office 2016 または 2019 を使用する場合は、ローカルシステムアカウントでサービスを再起動し、ユーザーアカウントのログインとパスワードを指定します。
注:デフォルトでは、以下のフォーマットのファイルを処理することができます: DOC, DOCX, ODT, HTM, HTML, TXT, RTF, XLS, XLSX, ODS, PPT, PPTX, ODP.
注:サポートされるフォーマットのリストは変更が可能です。 これを設定ファイルで行うには (% PROGRAMDATA%\ABBYY FineReader Server 14\Configuration.xml) が、Office アプリケーションそれぞれに必要なファイル拡張子のセットを指定する必要があります (\OnFileReceivedCustomOffice\ CustomOfficeConversionParams\CustomOfficeApplicationsタグのWordFilesMask、ExcelFilesMask、PowerPointFilesMask、VisioFilesMask 属性を参照してください。) 例えば、WordFilesMask="*.doc;*.docx;", と指定したら、 DOC および DOCX ファイルは(どちらの Office アプリケーションを選択したかによって) Microsoft Office Word または LibreOffice Writer によって開かれますが、 RTF ファイルを処理するアプリケーションは見つかりません。
注:以下の場合、Office ファイルはサードパーティアプリケーションによって読み取られません:
- サードパーティアプリケーションがライセンス提供されていない、または、アクティベーションされていないライセンスがある
- サードパーティアプリケーションは Office ファイルを開くデフォルトのアプリケーションではありません。
出力フォルダに電子文書をコピーする
電子文書を変換および認識せずに出力フォルダにコピーすると、 ライセンスのページカウンタが減ることはありません。 次の条件を満たす必要があります:
- 入力ファイルには、次のファイル拡張子が必要です: *.doc, *.docx, *.xls, *.xlsx, *.rtf, *.txt
- 各出力ファイルの形式は、対応する入力ファイルの形式と同じでなければならず、入力ファイルは他の形式にエクスポートしてはなりません。
- 3. ドキュメント分割タブの:
- ジョブ内の各ファイルに対して1つの文書を作成オプションを選択する必要があります
- 空白ページの削除オプションは選択しないでください
- 4. 品質管理タブで、検証なし添付ファイルを選択する必要があります。
- 5. インデックスタブでは、文書タイプを選択してはいけません。
注:最後の条件のを除き上記のすべての条件が満たされている場合は、つまり、 5. インデックスタブで1つまたは複数のドキュメントタイプが指定されている場合は、次の操作が実行されます:
- 入力ファイルは、変換、認識され、インデックス付けされます。
- ライセンスのページカウンタは、対応するページ数だけ減少します。
- インデックス付けによって割り当てられた属性を持つ入力ファイルは、出力フォルダーにコピーされます。
出力ファイルと入力ファイルは、同じ形式ではあるが異なるフォーマット設定(例えば、それぞれに異なるページサイズを指定)することができます。 デフォルトでは、出力フォーマット設定は無視され、入力ファイルはそのまま出力フォルダーにコピーされます。これらの入力ファイルも処理する必要がある場合は、それに応じて適切なワークフローのXMLチケットを変更します。これを行うには、ワークフローをエクスポートし、XMLファイルのエクスポートパラメーターでIsExportSrcEdocAllowed=falseを指定し、XMLチケットをFineReader Serverにインポートします。詳細については、「XMLチケットでワークフロー設定を修正するには」を参照してください。
26.03.2024 13:49:51