- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
Japanese (日本語) - Change language
Examples of use
An example of using extraction scripts in C#
FieldExtractor.ExtractRegularExpression( "(grant(s))|(convey to)|(grant)", "keyWords" ); FieldExtractor.ExtractWordsFromUserDictionary("dictionary", "English"); FieldExtractor.ExtractNerObjects(); // Access identified objects by collection name IExtractedObjects personObjects = FieldExtractor.ExtractedObjects( "NerPerson" ); IExtractedObjects keyWordsObjects = FieldExtractor.ExtractedObjects( "keyWords" ); // Look for matching person to left of keyword for( int i = 0; i < keyWordsObjects.Count; i++ ) { IExtractedObject keyWord = personObjects.Item( i ); IInterval span = keyWord.Span; IExtractedObject grantor = personObjects.Find( span.StartPos, false ); string grantorName = grantor.Value; if ( grantorName.Length > 2 && grantorName != "Doug Darrell" ) { FieldExtractor.SaveSpanToField( grantor.Span, "NlpField1" ); } } // Access source text string sourceText = FieldExtractor.SourceText; // Write any text span to field FieldExtractor.SaveTextToField( 0, sourceText.Length - 1, "NlpField2" ); // An XML query that looks for two-word dictionary phrases string query = "<Request> " + "<Query>" + "<Contain MaxDistance=\"1\">" + "<Required>" + "<Form><Attributes><Attribute>dictionary1</Attribute></Attributes></Form>" + "</Required>" + "<Required>" + "<Form><Attributes><Attribute>dictionary2</Attribute></Attributes></Form>" + "</Required>" + "</Contain>" + "</Query>" + "</Request>"; // Run query, get collection of results, and save them to field FieldExtractor.RunQueryAndSaveToField( query, "query1", "NlpField3"); // Run query and get collection of results IExtractedObjects queryResults1 = FieldExtractor.RunQuery( query, "query2" ); // An alternative way of accessing query results after running the query IExtractedObjects queryResults2 = FieldExtractor.QueryResults( "query2" ); |
Script parameters
Name | Type | Permissions | Value |
FieldExtractor | IFieldExtractor | Read | Identifies fields in the text of a document |
Sample address extraction script
The script is called for the entire source field.
// Parse the address this.ParseAddress(); // Extract the components into separate fields var zip = this.ExtractedObjects( "NerZipCode" ); var street = this.ExtractedObjects( "NerStreet" ); for( var i = 0; i < zip.Count; i++ ) { this.SaveSpanToField( zip.Item(i).Span, "ZipCode" ); } for( var j = 0; j < street.Count; j++ ) { this.SaveSpanToField( street.Item(j).Span, "Street" ); } |
Sample address extraction script
The script is called for part of the source field.
// Detect all NER objects in the text of the field or section this.ExtractNerObjects(); // Extract the Address object var address = this.ExtractedObjects( "NerAddress" ); // Split the address into components for( var addressSpanIndex = 0; addressSpanIndex < address.Count; addressSpanIndex++ ) { this.SaveSpanToField( address.Item(addressSpanIndex).Span, "Address" ); // Assign a unique prefix to the names of all component collections for the given address var collectionName = "nerAddress" + String(addressSpanIndex); // Extract the address this.ParseAddressInPosition( collectionName, address.Item(addressSpanIndex).Span.StartPos, address.Item(addressSpanIndex).Span.EndPos ); // Save the components into separate fields var zip = this.ExtractedObjects( collectionName, "NerZipCode" ); var street = this.ExtractedObjects( collectionName, "NerStreet" ); RunQueryAndSaveToField for( var i = 0; i < zip.Count; i++ ) { this.SaveSpanToField( zip.Item(i).Span, "ZipCode" ); } for( var j = 0; j < street.Count; j++ ) { this.SaveSpanToField( street.Item(j).Span, "Street" ); } } |
14.01.2021 14:17:22