コース: データ分析 入門1:基本

Power Queryでデータを変換する

コース: データ分析 入門1:基本

Power Queryでデータを変換する

Excel をビジネスシーンで 活用することは多く、 Excel の関数を使い データを変換したり、 マクロを使って自動化を 行うことを学んできた人は多くいます。 これらの機能を活用することは Power Query が登場するまでは 有効な手段と言えました。 Power Query は 関数やマクロ機能の代わりに シンプルな操作でデータのクリーニングと 変換を行うことができます。 注文データを使った 操作例を見ていきましょう。 07_01 フォルダ内の 07_01 OrderData_begin.xlsx ファイルを表示しています。 「データ」タブにある 「テーブルまたは範囲から」を選択します。 対象となるデータ範囲が認識され 先頭行が見出しであることを 確認するメッセージが表示されます。 OK をクリックします。 Power Query エディター画面が 表示されます。 画面右側を見てください。 データを取り込む操作は 自動的にいくつかの ステップを踏むことになります。 「ソース」と「変更された型」の 2つのステップが表示されています。 ステップ「ソース」をクリックします。 データ型が変換される前の データになりました。 読み込んだだけでは データ型は決まりません。 ステップ「変更された型」を選択します。 Power Query はデータの最初の行を見て 適切だと思われるデータ型に 変換してくれます。 しかし、都合のよいことばかりでは ありません。 例えば、「カスタムキー」列を見ると データ型が整数に設定されています。 このままピボットテーブルの 値として使用すると、 整数型の場合、合計が計算されます。 このような列はデータの個数を 表すことに使われることが多く、 ここでは整数ではなく テキストに変換しておくことにします。 「カスタムキー」列の左にある 1 2 3のアイコンをクリックし 「テキスト」を選択します。 ステップの置き換えを聞いてきますが 置き換えはしません。 「新規手順の追加」をクリックして 新しいステップとします。 画面を右へスクロールし 「プロダクトキー」列の データ型を「テキスト」に変換します。 「注文日」と「発送日」は 日付時刻型ですが、 時刻は必要ありません。 データ型を「日付」にします。 さらに右へスクロールし 「単価」のデータ型を「通貨」にします。 そして、「割引額」の列も データ型を「通貨」にします。 「税額」列と「売上額」列も データ型を「通貨」に変更します。 「閉じて読み込む」をクリックします。 元のデータと整形後のデータの 2つになりました。 シート名を Cleaned と変更します。 60351 行のデータが 読み込まれていることがわかります。 Power Query は データアナリストであるか否かに関わらず 日々の業務でデータを扱う人にとって 生産性を向上させることができる 有益なツールと言えます。

目次