用語集

ABBYY FineReaderタスク は文書を処理するためにプログラムが実行する必要がある一連の連続的手順です。  ABBYY FineReader 14 には最も一般的な文書処理のニーズのための多数のビルトインタスクが含まれます。 ユーザーは自分自身のカスタムタスクを作成することもできます。 ビルトインタスクは新規タスクウィンドウで開始できます。

ABBYY Hot Folder はユーザーが画像が含まれたフォルダーを選択し、そのフォルダーの画像を処理する時間を指定できるようにするスケジュール作成エージェントです。 ABBYY FineReaderは選択されたフォルダーの画像を自動で処理します。

ABBYY Screenshot Reader はユーザーがスクリーンショットを作成し、そこに含まれるテキストを認識できるようにするアプリケーションです。

ADF 自動文書フィーダは、文書をスキャナに自動的に送り込む装置です。 ADF付きのスキャナーは、手動での介入なしに複数のページをスキャンできます。ABBYY FineReaderは、複数ページの文書を操作できます。

ADRT® (適応文書認識技術) は、複数ページの文書の変換の品質を向上させる技術です。 たとえば、見出し、ヘッダー、フッター、脚注、ページ番号、署名などの構造要素を認識できます。

dpiでスキャンすることが推奨されます (1 インチあたりのドット数)は 画像の解像度の単位です。

OCR (光学文字認識)とは、コンピュータがテキストを読み、写真、表、その他の諸手記要素を検出できるようにするテクノロジーです。

OCRプロジェクト とは文書を処理するために、ABBYY FineReaderによって作成されたプロジェクトです。 文書のページの画像、認識されたテキスト(ある場合)および、プログラム設定が含まれます。

OCRプロジェクトオプションとはダイアログボックスで選択できる一連のオプションのことです オプション (このダイアログボックスは、 ツール > オプション... とクリックすると開きます)。 これらのオプションには、ユーザー言語、パターンなども含まれます。 OCRプロジェクトオプションは保存し、その後別のOCRプロジェクトで使用することができます。

PDFタブで選択します。 (ポータブルドキュメントフォーマット) は、一般的な文書の形式です。 PDFファイルは、そこに含まれるテキスト、フォント、グラフィックに関する詳細な説明のため、どのコンピュータ上でも同じ外観で表示されます。

PDFのセキュリティ設定 とは、PDF文書を開いたり、編集、コピー、印刷を行ったりできないようにする制限です。 これらの設定には、文書を開くパスワード、許可パスワード、および暗号化レベルが含まれます。

Unicode Unicode コンソーシアム (Unicode, Inc.) による国際テキストエンコード規格です。 Unicode規格は、ほとんどすべての現代言語記号をエンコードするため容易に拡張できる16ビットシステムを提供します。 記号をエンコードする方法を指定し、エンコード処理中に使用する必要があるアルゴリズムと文字プロパティを決定します。

トップに戻る

アクティブなエリア は画像上で選択されたエリアで、削除、移動または修正を行うことができます。 エリアをアクティブにするには、クリックします。 アクティブなエリアを囲む枠は太線で示され、サイズ変更ハンドルが付いています。このハンドルをドラッグすると、エリアの大きさを変更できます。

エリア 枠で囲まれた、特定の種類のデータを含む画像のセクションです。 OCR を実行する前に、ABBYY FineReader では、画像のどの部分をどのような順序で認識すべきかを決定するために、テキスト、画像、表、およびバーコードのエリアを検出します。

エリアテンプレート は外観が類似した文書内のエリアの大きさと位置に関する情報を含むテンプレートです。

オムニフォントシステム は、あらかじめ調整を行わずにあらゆるフォントとフォント サイズの文字を認識する認識システムです。

カラーモード 文書の色を保持するかどうかを決定します。 白黒画像は小さなサイズのOCRプロジェクトを作成し、処理速度も迅速です。

キーボードショートカットを使用します とは、押されたときに特定のアクションをトリガーするキーの組み合わせのことです。 ホットキーを使って大幅に生産性を高めることができます。

コードページ は文字とコードとの対応関係を確立する表です。 ユーザーは、利用できるコード ページから必要な文字を選択できます。

トップに戻る

サポート ID とは、ライセンスおよびライセンスが使用されているコンピュータに関する情報が含まれるシリアル番号の一意の識別子です。 サポート ID は、追加の保護を提供し、テクニカルサポートを提供する前にテクニカルサポートのスタッフによって確認されます。

ショートカットメニュー とは、エリア、文書の別の部分などを右クリックした場合に表示されるメニューです。

シリアル番号 プログラム購入時に受領する一意の番号です。 ライセンス認証時に使用されます。

スキャナ とは、画像をコンピュータに入力するための機器です。

スキャンモード とは、モノクロ、グレースケール、またはカラーのいずれで画像をスキャンする必要があるかを決定するスキャンパラメータです。

タグ付けされたPDF 論理的な部分、画像、表などの文書構造に関する情報が含まれている PDF文書です。 文書の構造は、PDFのタグでエンコードされます。 PDFファイルのこのようなタグはさまざまな画面サイズに合うように調整でき、ハンドヘルド デバイスではうまく表示されます。

テキストエリア とはテキストを含む画像エリアです。 テキストエリアには一列のテキストのみが含まれます。

ドライバー とは、コンピュータの周辺装置 (スキャナー、モニターなど) を制御するソフトウェアプログラムです。

トップに戻る

バーコードエリア はバーコードを含む画像エリアです。

パターン 平均化された文字の画像と、それぞれの名前との関連付けのセットです。 パターンは特定のテキストでABBYY FineReaderの学習機能を使用した場合に作成されます。

パラダイム とは、単語のすべての文法的な形式のセットです。

フォントのエフェクト はフォントの見かけのことです(例:太字、斜体、下線、取り消し線、下付き文字、上付き文字、スモールキャピタル)。

プライマリ形式  は、単語の「辞書形」のことです(辞書の見出し語は通常プライマリ形式で表記されています)。

ページレイアウト とは、ページ上のテキスト、表、写真、段落、列の配置のことです。 フォント、フォントサイズ、フォントの色、テキストの背景、テキストの方向もまた、ページレイアウトの一部です。

トップに戻る

ヘッダーとフッター とは、ページの上または下の余白部分の画像またはテキストです。 ヘッダーはページ上部、フッターはページ下部に配置されます。

ライセンスマネージャ とはABBYY FineReaderのライセンスと ABBYY FineReader 14 コーポレート。

ライセンス認証 は、ABBYY から特別なコードを取得するプロセスで、ユーザーはこのコードを用いて、所定のコンピュータで製品をフルモードで使用できます。

信頼性の低い単語 とは、1つ以上の信頼性の低い文字が含まれる単語のことです。

信頼性の低い文字 とは、プログラムが誤って認識した文字のことです。

写真エリア とは、写真が含まれる画像エリアです。 この種類のエリアには、実際の写真、または画像として表示する必要のあるその他のオブジェクト (テキストの一部など) を含めることができます。

区切り文字 区切り文字とは、単語を区切ることができ (/、\、ダッシュなど)、単語そのものからはスペースで区別される記号です。

反転画像 とは、暗い背景に白い文字が印刷された画像です。

トップに戻る

合字 とは2つ以上の文字が「結合」された組み合わせのことです(例:fi, fl, ffi)。 こうした文字をABBYY FineReaderが分割することは困難です。 これらの文字を1つの文字として扱うことにより、OCR の精度が向上します。

学習機能 とは、文字画像と文字そのものとの間の対応を確立することです。以下も参照してください: 印刷された文書に非標準のフォントが含まれている場合

文書タイプ とは、プログラムにどのように元のテキストが印刷されたかを告げるパラメータです(例えば、レーザープリンター、タイプライターなど)。 レーザー印刷のテキストの場合には以下を選択します:自動、 タイプライターのテキストの場合には以下を選択します:タイプライター、 FAXの場合には以下を選択します:FAX

文書の分析 とは、様々なタイプのデータを含む文書やエリアの論理構造を特定するプロセスのことです。 文書の分析は、自動的にも手動でも実行できます。

文書を開くパスワード とは作成者が指定したパスワードを入力しなければ、ユーザーが PDF文書を開くことができないようにするパスワードです。

明度(明るさ) は画像に含まれる白の量を反映する画像パラメータです。 明るさを増加させると画像は「白く」なります。 適切な明るさの値を指定すると、認識品質が増します。 以下も参照してください: スキャンのヒント

無視される文字 とは、単語に使われている文字以外の記号 (音節記号、アクセント符号など) です。 これらの記号は、スペルチェックの際に無視されます。

トップに戻る

略語 i単語またはフレーズの短縮された形です(例:MS-DOSはMicrosoftディスクオペレーティングシステム、UNは国際連合の短縮形です)。

省略可能なハイフン は、 (¬) 単語または単語の組み合わせが行末にきた場合に、分割すべき正しい位置を示すハイフン (¬) です (たとえば、「autoformat」は「auto–format」のように分割します)。 ABBYY FineReader では、辞書の単語にあるすべてのハイフンを、省略可能なハイフンで置き換えます。

禁止文字 認識するテキストでは発生しないと思われる文字です。 禁止文字を指定すると、OCR の速度と品質が向上します。

等幅フォント は、すべての文字の幅を等しくしたフォント (Courier New など) です。 より良いOCR結果を等幅フォントで得るために、OCR ダイアログボックスの オプション タブで タイプライター オプションのグループの ドキュメント タイプ を選択します。

背景画像のエリア はテキストオが印刷された写真を含む画像エリアです。

自動化されたタスク ABBYY FineReaderタスクを作成、設定、展開できるABBYY FINEREADER 14 のタスク管理コンポ―ネント。

トップに戻る

表エリア とは表形式でデータを含む画像エリアです。 この種類のエリアをプログラムが読み取る際に、表を形成するためにエリア内部に垂直および平行の区切り線を描きます。 このエリアは、出力テキストで表として表示されます。

製品 ID はABBYY FineReaderを所定のコンピュータでライセンス認証する際に、ハードウェア構成に基づき、自動生成されます。 これには、個人情報やソフトウェアやコンピューターに保存されているデータに関する情報は含まれません。

複合語 は、2つ以上の既存の単語から成り立っています。 ABBYY FineReaderでは 複合語 はプログラムが辞書で見つけられないものの、辞書の単語2つ以上で作成できる単語を指します。

解像度 とはインチあたりのドット (dpi) で計測されるスキャンパラメータです。 300 dpi の解像度は 10 pt フォント以上で設定されたテキストのために使用されるのに適しており、400 ~ 600 dpi は小さいフォントサイズのテキストに適しています (9 pt 以下)。

許可パスワード とは作成者が指定したパスワードを入力しなければ、他のユーザーが PDF文書を印刷したり、編集したりできないようにするパスワードです。 文書について何らかのセキュリティ設定が選択されている場合、作成者が指定したパスワードを入力しなければ、他のユーザーはこれらの設定を変更できません。

認識エリア とは、ABBYY FineReaderが自動分析すべき画像エリアです。

トップに戻る

11/2/2018 4:19:30 PM


Please leave your feedback about this article