コース: データ分析 入門1:基本

他の人のためにデータセットを作成する

コース: データ分析 入門1:基本

他の人のためにデータセットを作成する

データアナリストとして、 最高の誉め言葉のひとつは、 あなたが生み出すデータの信頼性が高く、 価値が高いということです。 こうしたデータを生み出すための 有益な方法を、いくつか紹介していきます。 まず、情報が多過ぎる ということはないということです。 必要な情報は、 ファイルに文書化しておけば、 覚えておく必要もなく、 必要なときに読み返すだけで良いのです。 これは、自分自身だけでなく、 相手にとっても良いことです。 データの出所やそのデータを扱う前に 行った作業などを、 文書化することをおすすめします。 文書化の例を見ていきましょう。 「05_05」フォルダ内で 右クリックします。 「New」から 「テキストドキュメント」をクリックし、 ファイル名に 「Read_Me」と入力します。 Enter キーを押して、 メモ帳を開きます。 「このデータは、私たちの 調査アンケートから得たものです。 元データは、このドライブの Original Data フォルダーに 保存されています。 データは、調査ツールから 直接取得したものです。 変換前に手を加えていません。」 と入力します。 では、このファイルを保存して閉じます。 これで、「Read_Me」ファイルを 参照したり、 必要に応じて、メモを残すことができます。 作業リストも作成します。 Excel ファイル 「ResearchData_WorkingFile」を 開きます。 「Information」シートがあります。 このシートには、 「Data」シート内の データに関する情報を記載します。 「Data」シートをクリックします。 最初にすることは、 ヘッダーを文書化することです。 セル A1 をクリックし、 Shift キーと Ctrl キーを押しながら、 右矢印キーを押します。 選択した列見出しをコピーします。 「Information」シートの セル A1 を選択して、貼り付けます。 その後、 「行/列の入れ替え」ボタンを クリックし、 「ホーム」タブから 「セルのスタイル」の標準を選択します。 列幅を広げ、 「折り返して全体を表示する」を クリックします。 セル B1 に、 「オリジナルフィールド」と入力します。 オリジナルフィールドは、 調査アンケートから 直接作成したものか、 追加したものかを表します。 オリジナルデータは、 Yes と入力し、 セルの右下角をダブルクリックして、 オートフィルで入力します。 さらに、セル C1 に 「このフィールドに関する情報」と 入力します。 セル C2 には、 「アンケート回答日」と入力します。 少し下へスクロールし、 「昇進」行を表示します。 セル C12 に、 「個別の回答を 1つの列にまとめるためにマージした」 と入力します。 セル C13 で、 Ctrl キーを押しながら D キーを押し、 上のセルと同じ内容を 繰り返し入力します。 セル A1 から C1 の文字を太字にし、 見出しとします。 オリジナルフィールドの列に、 No を入力すると、 誰が見ても 追加されたデータだということが わかります。 「Data」シートへ戻ります。 Ctrl キーを押しながら、 「ホーム」キーを押して、 セル A1 へ戻ります。 ここまでの作業を、画面左上の 「上書き保存」ボタンをクリックして、 保存します。 データに関わるすべての人が、 同じアクセスレベルであれば、 データを更新する際に、便利です。 しかし、すべての人が データへのアクセスレベルが 同じとは限りません。 そのため、 データにアクセスできない人のために、 文章をデータから 切り離しておく必要があります。 操作を見ていきましょう。 「Data」シート名の上を右クリックし、 「移動またはコピー」を選択します。 「コピーを作成する」をクリックし、 「(新しいブック)」をリストから選択し、 「OK」をクリックします。 「クエリ」タブをクリックします。 「削除」をクリックすると、 クエリを削除することで、 データを更新することは できなくなることが、 メッセージ表示されます。 「削除」をクリックします。 データと切り離されました。 元の Excel ファイルに戻り、 「Information」シート名の上で 右クリックし、 「移動またはコピー」を選択します。 「コピーを作成する」を選択し、 リストから「Book2」をクリックし、 さらに「(末尾へ移動)」を クリックしてから、 「OK」ボタンをクリックします。 必要な情報が揃いました。 誰が見ても読みやすいように、 整えていきましょう。 シート全体を選択し、 列幅を自動調整します。 表全体に、「格子」を設定します。 さらに、シートのタブの色を変更し、 「ResearchData ForTeam」 というファイル名を付けて、 保存します。 他の人がデータソースを使い 作業できるように、 文書を残すことで、 文書がない場合に比べ、 作業がしやすくなります。 データソースへは、 誰がデータにアクセスできるか 検討する必要があります。 また、文書化することで、 作業を振り返る必要がある際に、 役に立ちます。 そして、こうして情報を文書化することで、 他の人からの問い合わせにも使えます。 結果として、時間の節約にもなります。

目次