ユーザー辞書
ユーザー辞書は内蔵の辞書に含まれていない語が含まれているユーザー作成の補助辞書です。内蔵の辞書をユーザー辞書で補完し、データキャプチャの品質を改善できます。ユーザー辞書には通常、特殊な用語、略語、会社名などが含まれています。
認識前プロパティダイアログの言語タブで、ユーザー辞書を設定して有効にすることができます(このダイアログを開くには、FlexiLayoutまたは分類子メニューを開いて、プロパティをクリックして、高度な認識前プロパティ...ボタンをクリックします)。
既存のユーザー辞書は、以下の情報をともなってユーザー辞書フィールドにリスト化されます:
- 有効
はユーザー辞書が使用されているかを示します。 - 名前
カスタム辞書の名前。 - 言語
カスタム辞書の言語。
カスタム辞書の作成と編集
カスタム辞書を追加するには、事前認識プロパティダイアログの言語タブで、...追加ボタンをクリックします。次に、表示される新しい辞書を追加ダイアログボックスで、以下のプロパティを指定します:
- 辞書名
辞書の名前。 - 定義方法
辞書の種類: - 辞書ファイル
この種類の辞書はDICファイルに基づいています。 - 正規表現
この種類の辞書は正規表現に基づいています。
注意:辞書が作成された後で、辞書の種類を変更することはできません。
- 言語に中立
このオプションを有効にすると、有効なすべての認識言語で、すべての内蔵辞書とともにカスタム辞書が使用されます。言語パラメータが中立に設定され、この設定の変更が不可能になります。このオプションは、正規表現種類のユーザー辞書でしか使えません。 - 言語(ロケール)
辞書の言語はこのドロップダウンリストから選択できます。辞書が作成された後で、辞書の言語を変更することはできません。
OKボタンをクリックすると、すべての編集可能および編集不可能なパラメータのリストのあるダイアログボックスが表示されます。
辞書のプロパティを表示するには、辞書を選択して、編集ボタンをクリックします。辞書のプロパティダイアログの全般タブにはその全般プロパティが含まれます: 辞書の名前、種類、言語、ユーザーコメント。辞書が作成された後でも、辞書の名前を変更できます。
辞書のプロパティダイアログの辞書タブには、辞書の種類とユーザーアルファベットの設定に依存する設定が含まれています。
- 辞書を作成する時に辞書ファイル種類を選択する場合、ボタンをクリックしてDICファイルへのパスを指定するか、新しい辞書を作成...をクリックして新しい辞書を作成します。新しい辞書を作成すると決めたら、新しい辞書を作成ファイルダイアログボックスでその名前を指定し、OKをクリックして、エディタで設定を指定します。
辞書エディタのコマンド
辞書が作成されると、プロジェクトフォルダでDICファイルとして保存されます。
- 正規表現辞書種類を選択した場合は、表現を指定します。ボタンをクリックして、表現作成用メニューを開きます。詳細は正規表現で使用されるアルファベットをご覧ください。
注意:ユーザー辞書の単語は、内蔵辞書の単語よりも優先度が高くなります。辞書から単語を選好を有効にすると、辞書の単語の優先度が高くなります。
ユーザーアルファベット
辞書のプロパティダイアログの辞書タブでユーザーアルファベットアルファベットグループを作成できます。ユーザー辞書は、ユーザー辞書で使用される文字、区切り、プレフィックスおよびサフィックスのセットです。ユーザーアルファベットがユーザー辞書と一緒に使用される場合、ユーザーアルファベットにない文字を含む辞書語は、非辞書語と見なされます。言い換えれば、ユーザー辞書は、カスタム辞書で許容されている文字のセットを制限するために使用できます。
許容文字を指定するには、ユーザーカスタムアルファベットオプションを有効にして、テキストボックスまたはエディタを使用してアルファベット記号を指定します。編集ボタンをクリックしてエディタを開きます。
許容する区切り、プレフィックス、サフィックス、無視する文字を指定するには(わかりやすいように、このセクションではすべてを句読点と呼ぶことにします)、高度なパラメータボタンをクリックします。高度なカスタムアルファベットパラメータダイアログボックスで、句読点を指定します。
- 単語前の句読点
「_unknown」のアンダーバーなど、単語の先頭に隣接する句読点。 - 単語後の句読点
「user&」のアンドなど、単語の末尾に隣接する句読点。 - 独立した句読点
「January |」の縦棒など、個別に発生する句読点。
オプションの除外文字グループで単語をユーザー辞書と照合する時に、無視する記号を指定できます。例えば、正規表現「+33NNNNNNNN」とハイフォン(-)を無視する文字として指定すると、「+33-11111111」、「+33-111-11-111」、「+33-111-111-11」、は正規表現の合致と見なされます。
4/12/2024 6:16:07 PM