コース: データ分析 入門1:基本

集計データセットを作成する

コース: データ分析 入門1:基本

集計データセットを作成する

データを整え、集計し、平均化することを Excel を使って行う場合、 合計、平均、COUNT 関数を 使用することになりますが、 データ量が多いと 計算に時間がかかることがあります。 大量のデータに対して計算を行いたい場合、 Power Query では どのように行っていくのか 見ていきましょう。 OrderData ファイル内の クエリ Marketing を 使用します。 クエリ Marketing を 右クリックし、「編集」を選択します。 Power Query エディター画面が 表示されました。 クエリ Marketing を 右クリックし、 「参照」を選択します。 クエリ名の上で右クリックし、 「名前の変更」を選択し、 「礼状送付数」という名前にしましょう。 次に、「変換」タブを選択し、 「グループ化」をクリックします。 「お礼状」の列を データごとにグループ化し、 新しい列を作成します。 列名に「お礼状」を選択し、 「新しい列名」が「カウント」、 「操作」が「行数のカウント」 となっていることを確認します。 OK をクリックします。 これで、お礼状を出す 「送付対象」のデータ数と お礼状を出さない「無し」のデータ数が 集計されました。 次に、SalesOrderHeader クエリを見ていきましょう。 販売注文の件数をカウントしていきます。 さらに、平均受注件数や合計受注件数も 表示していきましょう。 データセットの上で右クリックし、 「参照」を選択します。 データセットの名前を 「注文合計」に変更します。 ここでは、行数をカウントし、 さらに注文額の合計と 注文額の平均も求めていきます。 「変換」タブの 「グループ化」を選択します。 「新しい列名」に「カウント」、 「操作」に「行数のカウント」 と表示されています。 次に、「詳細設定」を選択し、 「集計の追加」をクリックします。 「新しい列名」に「合計注文額」と入力し、 「操作」で「合計」を選択し、 「列」は「合計注文数」を選択します。 さらに、「集計の追加」をクリックして、 注文金額の平均を求めましょう。 「新しい列名」に「平均注文額」と入力し、 「操作」で「平均」を選択し、 「列」で「合計注文数」を選択します。 注文日や発送日など、グルーピングする列を 変更することもできます。 OK をクリックします。 顧客ごとのデータ数のカウントと 合計注文金額、平均注文金額が 表示されました。 合計注文額と平均注文額は、 データ型を「通貨」に変換しておきます。 平均注文額を合計注文額より先に、 つまり左側に表示するとしたら、 列をドラッグして 入れ替えることもできますが、 先ほどのグループ化設定に戻り、 変更することもできます。 そのために、 ステップ「グループ化された行」の 歯車記号をクリックします。 「平均注文額」の右端にある 3点ボタンをクリックすると、 「上へ移動」を選択できます。 順番を変更できました。 もし、カウント列が不要であれば、 3点ボタンをクリックして 「削除」を選択することもできます。 OK をクリックします。 これで、各顧客ごとの平均注文額と 合計注文数が表示されました。 「ホーム」タブの 「閉じて読み込む」をクリックします。 シート名は「顧客別集計」に変更します。 データを集計する必要がある場合、 そのプロセスを Power Query を用いることで 簡素化できれば、 人為的なミスを減らすことができ、 データの信頼性も高めることができます。

目次