データ要件
プロセス分析により、構成されたビジネスプロセスのチェーンの中で特定のイベントを評価することができます。
ビジネスプロセスの例としては、受注、請求書発行、製品の発送、従業員情報の更新、顧客へのサービスなどがあります。ビジネスプロセスは、組織のあらゆるレベルのアクティビティで発生し、顧客の目に触れるイベントや情報システムに隠されているイベントが含まれます。また、ビジネスプロセスは最終的なビジネス目標の達成に向けた個別のステップすべての組み合わせも指します。
ABBYY Timelineに必要なデータの種類とは?
ABBYY Timelineは各イベントログに、ケース、アクティビティ(イベント)、発生日時を含むことを前提としています。イベントログは複数のケースのコレクションとして見ることもできますし、単独のケースを複数のイベントのトレース/シーケンスとして見ることもできます。
イベントデータはさまざまなソースから取得されます:
- データベースシステム(例:病院の患者データ)
- カンマ区切り値 (CSV) ファイルまたはスプレッドシート
- トランザクションログ(例:トレーディングシステム)
- ビジネススイート/ERPシステム (SAP、Oracleなど)
- メッセージログ(例:IBM middlewareから)
データセットの例
日時 | OrderID | ワークフローステップ | 従業員 | ロケーション | 曜日 | シフト |
2016-02-07 10:50:00+00 | 100012 | 受注 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-08 00:49:00+00 | 100012 | 既存顧客確認 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-08 08:03:00+00 | 100012 | 在庫確認 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-09 11:40:00+00 | 100012 | 注文保留 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-11 01:39:00+00 | 100012 | 在庫梱包 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-11 17:37:00+00 | 100012 | 商品出荷 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-13 14:30:00+00 | 100012 | 商品受領 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-02-14 17:42:00+00 | 100012 | 注文完了 | トーマス・ムーア | フィラデルフィア | 木曜 | 第3 |
2016-01-14 21:14:00+00 | 100013 | 受注 | トーマス・ムーア | サンフランシスコ | 月曜 | 第3 |
ABBYY Timelineのデータファイル要件
ABBYY Timelineプラットフォームにデータを読み込む最も一般的な方法は、CSVファイルを使用することです。本文書は、このCSVファイルの生成に関連するいくつかのヒントやコツと共に、ファイルに必要な構造について説明します。
ファイル構造
データはカンマ区切りファイルに配置されている必要があります。ファイルの各行はイベントを表します。イベントとは、特定の時間に特定のオブジェクトに何かが起こったという記録です。このファイルには3つの必須列が必要であり、それ以上であれば任意の数の列をオプションとして含めることができます。すべての列に任意の名前を付けることができますが、複数列に同じ名前を付けることはできません。
必須の列について:
- タイムラインID(TimelineID) – 時間を追って追跡するオブジェクトの識別子(ケース/オブジェクト)の列。注文ID、請求ID、患者番号、サポートのチケット番号等がこれにあたります。
- タイムスタンプ – オブジェクトの存続期間中に何かが発生したことを示すタイムスタンプの列。この列には通常日付と時間が含まれます(形式に関する下記説明を参照)時間の情報がなく日付のみが提供された場合は、真夜中 (12:00 AM、00:00:00) が使用されます。
- イベント名 – その時点でオブジェクトに何が起こったのかを説明する列 – 注文送信、患者退院、査定人担当割り当て、チケットのエスカレーションなど。
オプションの列
必須の列に加え、ファイルには多くの追加列を含めることができます。追加列は、ディメンション属性として使用されます。これらのフィールドを使ってフィルタしたり、グループでブレークダウン(分類、詳細把握)し、プロセスを分析する際の追加情報として使うことができます。
レコードの順序
ファイル内のレコードの順序には重要性はありませんが、1つ例外があります。同一オブジェクト(ケース/識別子)内の複数のレコードに同じタイムスタンプがある場合、アプリケーションはファイル内に並べられた同じ順序でこれらのレコードを並べます。
ファイルのサンプル
TimelineID | タイムスタンプ | イベント名 | 従業員 | ロケーション |
A | 1/16/2017 7:20:15 | 生徒申込 | ジョン | ボストン |
A | 3/10/2017 16:54:10 | 生徒入学許可 | マリー | ボストン |
A | 4/11/2017 15:04:00 | 請求書生成 | アン | シャーロット |
B | 2/1/2017 9:15:00 | 生徒申込 | ジョン | ボストン |
B | 3/2/2017 16:20:05 | 生徒入学許可 | マリー | ボストン |
この例のAとBは識別子(オブジェクト/ケース)であり、個別にいつ、何が発生したかが判ります。この例では、入学申請における生徒IDを指します。イベント名は「生徒申込」、「生徒入学許可」などです。
CSVファイル内では、これは以下のように表示されます:
TimelineID;タイムスタンプ;イベント名;従業員;ロケーション A;1/16/2017 7:20:15;生徒申込;ジョン;ボストン A;03.10.2017 16:54;生徒入学許可;マリー;ボストン A;04.11.2017 15:04;請求書生成;アン;シャーロット B;02.01.2017 9:15;生徒申込;ジョン;ボストン B;03.02.2017 16:20;生徒入学許可;マリー;ボストン
よくある問題
データファイルで一般的に発生する問題は、正しくない日付/時間フォーマットと、ファイルフォーマットが間違っている場合です。
日付/時間フォーマットの問題
ファイルのタイムスタンプは、必ず、この秒を含むいずれかの形式で保存するようにしてください。
- 1/6/2017 7:20:15
- 1/6/2017 7:20:15 AM
- 2017-01-06 7:20:15
- 2017-01-06T7:20:15Z
Excelのデフォルトの時間フォーマットには秒が含まれないことを忘れないでください。ExcelでCSVファイルに秒を保存するためには、カスタム形式に切り替え、「m/d/yyyy h:mm」を選択して、これを「m/d/yyyy h:mm:ss」に変更します。
ファイルフォーマットの問題
フィールドの値にカンマが含まれる場合、ファイルのフォーマットが崩れる可能性があります。これを避けるため、文字列修飾子として二重引用符を必ず指定してください。Microsoft Excelはこれを自動で実行しますが、MS SQL Export Wizardなどの一部のツールでは、手動の設定が必要となります。
ファイルは、ロケール:英語(米国)およびUS ASCIIまたはUTF-8エンコードされている必要があります。
22.09.2023 8:59:48