コース: データ分析 入門1:基本

初心者にありがちな間違いを発見する

コース: データ分析 入門1:基本

初心者にありがちな間違いを発見する

次に経験の浅いデータアナリストが 侵しがちなミスを紹介します。 まず、データを理解するための 時間を確保しないことは 危険なミスへとつながります。 ピボットテーブルを表示させたり 集計することはそんなに難しい ことではありませんが、 データアナリストとして そのデータがどのような構造に なっているのか、 そしてそれが全体的な目的にとって どのような意味を持っているのかを 理解することが大切です。 データセットの大小に関わらず フィールドの見出しが何であるか、 データ型で何であるかを確認し、 そして値を理解することに 時間を惜しまないでください。 次にデータセット内の 重複データを検索しないことも 大きな問題です。 前もって時間をかければ、 重複データを検出することはできます。 しかし、重複データは探さなければ 発見することは不可能です。 扱うデータセットで 事前に合計や平均、 数のカウントなどの 予備的な計算も必要です。 あとで分析手順を検証する際に 必要となってきます。 各データセットのレコード数は データを扱う上で 非常に貴重な情報です。 クエリでデータを結合する場合、 データセットを検証するために 予めレコード数を把握しておく 必要があります。 例えば、次のようなケースです。 販売レコードは 1000 件で 商品レコードが 50 件のデータで 販売注文レポートを作成する場合、 販売件数が 1000 件を超えることは ありません。 しかし、突然 50000 件の 販売レコードが表示されたとしたら、 すぐにデータに問題があることが わかります。 次に侵しがちなミスは 時間を有効活用できないと いうことです。 意思決定者に質問する際など 事前に質問内容を 文書化しておくなどの準備が必要です。 なぜなら事前に文書化することで 聞き漏らしを防げ 無駄な時間を減らせます。 さらに受け取った回答を文書化することで 自分の理解が正しいかを 確認することができます。 データアナリストとして もっとも怖いことのひとつは 数値の検証をしていないということです。 数値を表示させることは 誰でもでき、それが正しいように 見えるかもしれないということを 知っておくことです。 例えば、年次総会で「今年は 過去最高の年だ」と 「過去最悪の年だ」と発表する前に その結果の検証を十分に 行う必要があるということです。 その結論が本当に正しいのか 検証をする必要があります。 データアナリストとしての 経験の浅さ、豊かさに関わらず、 数字と計算の検証は必要です。 こうしたデータ分析を進めるなかで 疑問が出てきたときは 恐れず質問する必要があります。 答えを推測することは危険です。 実際にはデータ分析に必要としている データがすべて提供されているとは 限りません。 必要なドキュメントを データを持っている相手に求めてください。 必要なドキュメントが揃っていることで 十分なデータ分析をすることができます。 他にも既存のレポート分析に 十分な時間を割かないという人もいます。 システムからアウトプットされる レポートを分析することは 有益なことです。 時間の節約にもつながります。 システムからのレポートを分析し データ構造を理解することには 価値があります。 また、広範囲のレポートを分析することも 有用です。 しかし、必ずしも分析に必要な レポートやデータを 提供してもらえるとは限りません。 その場合はデータ分析に必要な 情報について丁寧にたずねてみましょう。 ベテランのデータアナリストなど 他の人のスキルに頼り ミスを避けることは 悪いことではありません。 こうして得たデータ分析の結果に対し 自信を持つことができるでしょう。

目次