コース: データ分析 入門1:基本

オリジナルデータを維持する

コース: データ分析 入門1:基本

オリジナルデータを維持する

システムなどから、 常に分析に適したデータセットを 受け取れるとは限りません。 スプレッドシートしか受け取れなかったり、 データへのアクセスが 制限されていることもあります。 また、CSV ファイルを 受け取ることもあります。 どのような場合でも、 受け取ったオリジナルデータの バックアップと、 作業工程ごとに ファイルを保存しておくことは重要です。 そうすることで、 すべてを最初からやり直すことなく、 作業途中から再スタートでき、 作業工程を残すことができるからです。 例を見ていきましょう。 私は、データベース管理者や IT 部門のメンバーから 月次レポートのデータセットを受け取り、 それをあなたに送ります。 その後、あなたはデータを整え、 レポートを作成し、 月ごとにチームに提出するとします。 こうしたケースの場合、 あなたは送られてきたデータセットを 専用のフォルダ、 例えば、「オリジナルデータ」という名前の フォルダを作成して、 保存しておくでしょう。 画面上で右クリックして、 新規フォルダを作成します。 名前は、「オリジナルデータ」です。 このフォルダの中を見れば、 オリジナルのデータセットが あることがわかります。 ここでは、HireData という CSV ファイルを、 「オリジナルデータ」フォルダへ 移動します。 CSV ファイルを ドラッグ&ドロップします。 その後、「オリジナルデータ」 フォルダを開きます。 フォルダ内のファイルを 読み取り専用にします。 ファイル名を右クリックして、 プロパティを選択し、 「読み取り専用」をクリックして、 チェックマークを付けます。 そして、「OK」ボタンをクリックします。 次に、ファイルのコピーを作成します。 HireData の CSV ファイルを ダブルクリックで開きます。 開いたファイルは、 「読み取り専用」になっていることが 確認できます。 このファイルを編集用として 名前を付けて保存するために、 F12 キーを押します。 「04_05」フォルダへ ファイル名を 「採用データ_作業用ファイル」として 保存します。 このとき、 「ファイルの種類」をクリックし、 Excel ブックを選択します。 そして、「保存」ボタンをクリックします。 これで、オリジナルファイルと コピーした作業ファイルができました。 このような手順で操作をすすめれば、 オリジナルデータを維持したまま、 作業をすすめることができます。 データに対して最初に行うことは、 データのクリーニングでしょう。 例えば、次のような操作があります。 列幅の調整です。 全セル選択ボタンをクリック後、 A 列と B 列の間を ダブルクリックして、 列幅を自動調整します。 もし、B 列から D 列までが 不要な列だとすれば、 B、C、D の列を選択し、 右クリックし、削除を選択します。 さらに、見出し行の書式を設定します。 セル A1 をクリックします。 ショートカットキーを使いましょう。 Ctrl キーと Shift キーを 同時に押しながら、 右矢印キーを押し、 見出し範囲を選択します。 さらに、Ctrl キーを押しながら、 B のキーを押して、 太字に設定します。 これで Excel は A1 から G1 が列の見出し、 ヘッダー範囲だと認識します。 セル A1 をクリックします。 ここまでの操作を、 名前を付けて保存します。 F12 キーを押し、 ファイル名に 「採用データ_クリーニング済み」と 入力して、保存します。 このように、作業過程の都度、 名前を付けてファイルを保存しておけば、 新しい要求や変更があっても、 すべての作業を最初から行わず、 途中から行うことができます。 ファイルを閉じましょう。 「採用データ_作業用ファイル」を ダブルクリックして開きます。 作業工程の都度、 ファイルを作成するだけではなく、 シートを増やすことも有効な手段です。 シート名をポイントし、 Ctrl キーを押しながら そのまま右へドラッグし、 マウスポインターが白い矢印で、 コピーを示す 小さな+記号が見える状態で マウスから手を離します。 そして、Ctrl キーも離します。 シートのコピーができました。 シート名をダブルクリックして、 「採用データ_作業用」 という名前に変更します。 このように操作すれば、 新しくコピーしたシートで 作業をやり直す必要があるときに 対応できます。 オリジナルデータを維持しながら、 どこからでも作業が再開できるように ファイルやシートを保存する手順を 学んできました。 さらに、ファイルの保存には、 保存先であるフォルダ構成も大切です。 どのようなデータが保存されているか、 誰が見ても判断できるように 作成しましょう。 しかし、ファイルの保存方法は、 組織によってさまざまです。 サーバーに保存する場合もあれば、 クラウドストレージに 保存するケースもあります。 保存方法に関わらず、 フォルダやファイル構成を検討し、 作業することは重要です。

目次