コース: データサイエンス入門:基本を理解する

洞察を見つけて知識を得る

コース: データサイエンス入門:基本を理解する

洞察を見つけて知識を得る

過去20年にわたり、多くの組織が 業務効率の向上に注力してきました。 ビジネスプロセスの合理化に取り組み、 スマートな組織を目指しました。 迅速に仕事を進めるために、 運営上の問いを立てたのです。 一方、データサイエンスでは、 達成可能な目標には着目しません。 科学的手法を使う調査で、 有益なビジネス知識の獲得を目指します。 データサイエンスでは、 さまざまな種類の問いを立てます。 顧客について何を知っているか。 どうしたらより良い製品を提供できるか。 競合他社よりできているところはどこか。 自分たちが市場を去るとどうなるか。 これらは、より上のレベルの思考が 求められる問いです。 このような問いを立てられる組織は 多くありません。 結果を出すことや、 マイルストーンの設定で精一杯です。 疑問を持ったり探索的になったりしても 見返りがありません。 例えば会議で、同席している人が 質問をしているとします。 なぜこの方法なのですか。 うまくいくのはなぜですか。 なぜこれが良い考えなのですか。 この人は鬱陶しいと思われそうです。 資料を見てないのかと 怒る人もいるでしょう。 しかし、組織的な知識を得るには 必要なことです。 データサイエンスチームから 出てほしい質問です。 それでも、多くの人は物事をこなすことに 注力します。 質問は新たな可能性を探るきっかけなのに、 前進を阻むものと見なされることも あります。 組織は、意味深い問いを立てることでのみ 知識を得ることができます。 私は、車を探す人と販売店を ウェブでつなぐ仕事をしていました。 そのサイトでは、 何百もの情報タグを作成しました。 マウスオーバーやリンクのクリックが 分かります。 このデータはすべてハドゥープに 取り込まれました。 毎週、膨大なデータが集まり、 過去何年分ものデータがありました。 会社は多額の資金を投じて、 データを収集、保守する専用の部門を 作りました。 ソフトウェアは単純で、 データ収集は簡単でした。 難しかったのは、 データを使って何をするかでした。 そこで、どのような問いができるか 考え始めました。 これはデータサイエンスを始めた組織に よくある課題です。 このような組織は、 主に運用上の課題を見ています。 まず、データの収集に関することです。 できるだけ多くのデータを収集して、 ハドゥープクラスターに保存します。 必然的に、データの技術的な面に 焦点が当たります。 データサイエンスが 科学として捉えられていません。 データの収集は比較的安価で 分かりやすいので当然の流れではあります。 骨が折れることは後回しにして、 クラスターを複数作成し、 かき集めたデータをプールするわけです。 多くの組織が科学に苦心しています。 問いを立てることに慣れていないのです。 このウェブサイトに対する問いを 考えてください。 車の色を変えたらどうですか。 画像が赤、青、黄色の場合で、 顧客のクリックの傾向が 変わるかもしれません。 赤の場合、クリック率が2%高くなることが 分かったらどうしますか。 販売店と情報を共有して 新たな収益を創出できます。 1ページに表示する車の数についての 実験はどうですか。 表示される車の数を少なくして、 リンクのクリック率が変化したかを レポートで確認できます。 データサイエンティストは、 常にこのような実証研究について 考える必要があります。 データを微調整し、意味深い問いを立てて 実験を行い、適切に設計されたレポートを 作成します。 データサイエンスは 問いから始め、実験します。 実験を行ったら、スプレッドシートや ソフトウェアを使用して、 レポートを作成します。 そのレポートを見て、本質的な洞察が 得られるかどうかを確認するのです。

目次