コース: データ分析 入門1:基本

データのETLを理解する

コース: データ分析 入門1:基本

データのETLを理解する

日常的にレポート作成が必要な場合、 最適なデータソースを入手し、 最適なツールでデータを 加工する必要があります。 そのために高性能なツールを 用意する必要はなく、 利用可能な範囲のツールでも 十分対応可能です。 あまり難しく考える必要はありません。 手持ちのデータを読みやすく 意味のある状態にする方法から 学んでいくことが大切です。 データソースからデータを取得し、 データを変換したり抽出し、 他の人が利用できるよう配置するプロセスを ETL と言います。 ETL はデータ分析の 重要なプロセスです。 ETL とは、 「抽出、変換、読み込み」の略です。 ETL の手順でデータを操作していき、 レポートを作成していきます。 ETL は さまざまなデータに適用できます。 さて、ETL の T である変換は、 データのクリーニングや標準化、 取得していないデータへの対応を 行う段階です。 ここでは、さまざまなツールを使った データのクリーニングと モデリングのプロセスについて 説明していきます。

目次