集計
概要
集計は、データベースの情報を組み合わせて、データ処理に必要なデータセットを準備するためのものです。Timelineでは、プロジェクトスペース管理に役立つツールとされています。集計は、プロジェクトが大きなデータセットから小さなサブセットの情報だけを必要とする場合に役立ちます。プロジェクト内のデータスペースを最も効果的に使用するために、データをアップロードして、現在のタイムラインで必要な測定基準の計算を作成し、これらのタイムラインを削除できます。こうして、プロジェクト内の実際のデータを常に保持することなく、より大きなデータセットの測定基準データを持つことができます。
集計は、すでに作成された測定基準に基づいています。作成方法については、測定基準を参照してください。
集計の設定方法
- 集計ツールを開きます。これを行うには、 > プロジェクト設定 > 集計をクリックします。集計エディタウィンドウが開きます。
- 計算するには、測定基準追加をクリックします。集計エディタでは、既存の測定基準だけが使えるため、必ず事前に作成しておいてください。複数の測定基準を選択できます。
重要:一部の測定基準は、初期設定により集計できません。これらは抽出測定基準と標準偏差、90パーセンタイル、75パーセンタイル、25パーセンタイル、10パーセンタイル、および中央値の集約関数を使用したものです。 - 計算にディメンション(イベントと属性のペア)を追加し、名前を付けます。複数のディメンションを選択できます。
- オプション:リストから未使用の測定基準またはディメンションを削除するには、をクリックします。チェックボックスをオンにして要素を選択して削除をクリックすれば、それらを削除できます。
- 対象時間幅を定義します: 毎時、毎日、毎週、毎月。集計データテーブルの構築に使うタイムスタンプのステップを設定します。
詳しい説明については、集計データおよび例を確認してください。 - 設定を保存します。
- 保存をクリックして後で計算するようにします。次回プロジェクトにデータがアップロードされると、自動的に実行されます。
- 計算された結果テーブルを取得するには、保存して再計算するをクリックします。複雑な計算は長時間がかかるため、中止をクリックしていつでもキャンセルできます。
重要:計算を中止すると、すでに集計されているデータが失われる可能性があります。プログラムはこれを警告します。 - 計算結果を表示するには、計算データを表示をクリックします。集計データウィンドウが開きます。詳しい説明については、集計データおよび例を参照してください。
- アップロードされたタイムラインを削除できるようになり、計算されたデータが保持されます。以降のアップロードから集計されたデータは自動的に計算され、既存のテーブルに追加されます。プロジェクトにデータをアップロードし、集計に移動して計算データを表示クリックします。更新されたテーブルが表示されます。
集計データおよび例
集計データウィンドウは、計算結果をテーブルビューで表示します。テーブルには、選んだ対象時間幅に基づくイベントのタイムスタンプを含むデフォルトの列1つが含まれます。その他のテーブル列は、集計に追加された測定基準とディメンションが示されます。これにより、特定のタイムスタンプを持つイベントの測定基準または属性の値が表示されます。
タイムラインが削除された後もデータが保存されるので、新しいアップロードは集計データテーブルの既存の列に値を追加してテーブルを拡張します。
例
Alteryxコネクタを使用した集計
集計は、Alteryxデータエクスポートのソースとして機能します。Alteryxでは、さまざまな内訳の測定基準値が必要です。また、すべてのエクスポートのデータを計算するにはリソースがかかりすぎるため、このデータを集計として保持できます。例:
- Alteryxからプロジェクトにデータをアップロードします。
- Timelineで作成した集約関数を追加します。
注:Alteryxは単純な測定基準(合計、最小、最大、カウント)のみをエクスポートします。 - 保存された集計測定基準は、Alteryxコネクタを使用してプロジェクトからエクスポートされ、さらなる分析またはサードパーティのプログラムで表示されます。
コネクタの詳細については、データソース:Alteryxを参照してください。
05.09.2024 16:23:55