用語集
OCR (光学文字認識)とは、コンピュータがテキストを読み、写真、表、その他の諸手記要素を検出できるようにするテクノロジーです。
OCRプロジェクト とは文書を処理するために、ABBYY FineReaderによって作成されたプロジェクトです。 文書のページの画像、認識されたテキスト(ある場合)および、プログラム設定が含まれます。
Unicode Unicode コンソーシアム (Unicode, Inc.) による国際テキストエンコード規格です。 Unicode規格は、ほとんどすべての現代言語記号をエンコードするため容易に拡張できる16ビットシステムを提供します。 記号をエンコードする方法を指定し、エンコード処理中に使用する必要があるアルゴリズムと文字プロパティを決定します。
ア
アクティブなエリア は画像上で選択されたエリアで、削除、移動または修正を行うことができます。 エリアをアクティブにするには、クリックします。 アクティブなエリアを囲む枠は太線で示され、サイズ変更ハンドルが付いています。このハンドルをドラッグすると、エリアの大きさを変更できます。
エ
エリア 枠で囲まれた、特定の種類のデータを含む画像のセクションです。 OCR を実行する前に、ABBYY FineReader では、画像のどの部分をどのような順序で認識すべきかを決定するために、テキスト、画像、表、およびバーコードのエリアを検出します。
エリアテンプレート は外観が類似した文書内のエリアの大きさと位置に関する情報を含むテンプレートです。
オ
オムニフォントシステム は、あらかじめ調整を行わずにあらゆるフォントとフォント サイズの文字を認識する認識システムです。
キ
キーボードショートカットを使用します とは、押されたときに特定のアクションをトリガーするキーの組み合わせのことです。 ホットキーを使って大幅に生産性を高めることができます。
コ
コードページ は文字とコードとの対応関係を確立する表です。 ユーザーは、利用できるコード ページから必要な文字を選択できます。
シ
ショートカットメニュー とは、エリア、文書の別の部分などを右クリックした場合に表示されるメニューです。
ス
スキャンモード とは、モノクロ、グレースケール、またはカラーのいずれで画像をスキャンする必要があるかを決定するスキャンパラメータです。
テ
テキストエリア とはテキストを含む画像エリアです。 テキストエリアには一列のテキストのみが含まれます。
バ
バーコードエリア はバーコードを含む画像エリアです。
パ
パターン 平均化された文字の画像と、それぞれの名前との関連付けのセットです。 パターンは特定のテキストでABBYY FineReaderの学習機能を使用した場合に作成されます。
パラダイム とは、単語のすべての文法的な形式のセットです。
フ
フォントのエフェクト はフォントの見かけのことです(例:太字、斜体、下線、取り消し線、下付き文字、上付き文字、スモールキャピタル)。
プ
プライマリ形式 は、単語の「辞書形」のことです(辞書の見出し語は通常プライマリ形式で表記されています)。
ペ
ページレイアウト とは、ページ上のテキスト、表、写真、段落、列の配置のことです。 フォント、フォントサイズ、フォントの色、テキストの背景、テキストの方向もまた、ページレイアウトの一部です。
ヘ
ヘッダーとフッター とは、ページの上または下の余白部分の画像またはテキストです。 ヘッダーはページ上部、フッターはページ下部に配置されます。
信
信頼性の低い単語 とは、1つ以上の信頼性の低い文字が含まれる単語のことです。
信頼性の低い文字 とは、プログラムが誤って認識した文字のことです。
写
写真エリア とは、写真が含まれる画像エリアです。 この種類のエリアには、実際の写真、または画像として表示する必要のあるその他のオブジェクト (テキストの一部など) を含めることができます。
区
区切り文字 区切り文字とは、単語を区切ることができ (/、\、ダッシュなど)、単語そのものからはスペースで区別される記号です。
反
反転画像 とは、暗い背景に白い文字が印刷された画像です。
合
合字 とは2つ以上の文字が「結合」された組み合わせのことです(例:fi, fl, ffi)。 こうした文字をABBYY FineReaderが分割することは困難です。 これらの文字を1つの文字として扱うことにより、OCR の精度が向上します。
学
学習機能 とは、文字画像と文字そのものとの間の対応を確立することです。以下も参照してください: 印刷された文書に非標準のフォントが含まれている場合。
文
文書タイプ とは、プログラムにどのように元のテキストが印刷されたかを告げるパラメータです(例えば、レーザープリンター、タイプライターなど)。 レーザー印刷のテキストの場合には以下を選択します:自動、 タイプライターのテキストの場合には以下を選択します:タイプライター、 FAXの場合には以下を選択します:FAX。
文書の分析 とは、様々なタイプのデータを含む文書やエリアの論理構造を特定するプロセスのことです。 文書の分析は、自動的にも手動でも実行できます。
無
無視される文字 とは、単語に使われている文字以外の記号 (音節記号、アクセント符号など) です。 これらの記号は、スペルチェックの際に無視されます。
禁
禁止文字 認識するテキストでは発生しないと思われる文字です。 禁止文字を指定すると、OCR の速度と品質が向上します。
等
等幅フォント は、すべての文字の幅を等しくしたフォント (Courier New など) です。 より良いOCR結果を等幅フォントで得るために、OCR ダイアログボックスの オプション タブで タイプライター オプションのグループの ドキュメント タイプ を選択します。
背
背景画像のエリア はテキストオが印刷された写真を含む画像エリアです。
表
表エリア とは表形式でデータを含む画像エリアです。 この種類のエリアをプログラムが読み取る際に、表を形成するためにエリア内部に垂直および平行の区切り線を描きます。 このエリアは、出力テキストで表として表示されます。
複
複合語 は、2つ以上の既存の単語から成り立っています。 ABBYY FineReaderでは 複合語 はプログラムが辞書で見つけられないものの、辞書の単語2つ以上で作成できる単語を指します。
解像度 とはインチあたりのドット (dpi) で計測されるスキャンパラメータです。 300 dpi の解像度は 10 pt フォント以上で設定されたテキストのために使用されるのに適しており、400 ~ 600 dpi は小さいフォントサイズのテキストに適しています (9 pt 以下)。
認
認識エリア とは、ABBYY FineReaderが自動分析すべき画像エリアです。
26.03.2024 13:49:51