コース: データ分析入門

ソースデータについて

コース: データ分析入門

ソースデータについて

データアナリストとして ソースデータを扱うことは常に有益ですが、 それがいつも可能とは限りません。 ここでは、ソースデータについて 解説しましょう。 そもそもソースデータとは何でしょうか? 様々な場所にある大元のデータです。 ソースデータはそこから情報が始まり、 データが蓄積されている場所です。 特定の場所にあり ほとんどは正確なデータです。 さらにソースデータは 様々な場所に存在することを 理解しておくことが重要です。 またソースデータは様々なシステムで 生成されますが、 データ構造はほとんど変更されません。 では、例を見てみましょう。 こちらの組織には、 2つのツールがあります。 すべての従業員データが存在する 人事管理システムと 各従業員が利用する学習管理システムです。 どちらも馴染み深いシステムです。 ソースデータは複数の場所に存在します。 この2つのツールは お互いに通信はしません。 人事管理システムを見ると、 スタッフの名前や住所など個人情報と 福利厚生や給与などの項目があります。 人事に関するソースデータは ひとつの場所に管理されています。 学習管理システムにも、 スタッフの情報がありますが、 動画やセッション、ログイン情報も あります。 ソースデータは複数の場所で 利用されています。 HR システムでは、 スタッフ全員のデータを一元的に 管理・更新していますので、最新です。 一方、LMS システムのスタッフデータは どうでしょうか? データの作成時点のスタッフ情報のままで、 HR システムに合わせて 更新されていないこともありえます。 プロセスが実施されているという 理由だけでは、データが常に最新であるとは 限りません。 従って、正確なスタッフ情報の レポートが必要な場合は、 人事管理システムと関連付けて データを取得する必要があります。 様々なシステムのソースデータを調べ 情報を洗い出すことが重要です。 データセット別に 最適なメインのデータソースと 保管場所を確認する必要があります。 常にソースデータから直接レポートを 作成できれば、正確で優れた結果が 得られます。 一部の組織では、IT 部門によって ソースデータが取得され、 別の部門に配信され、 またマネージャーに配信されてから 配信されるケースもあります。 直接ソースデータにアクセスすることで より正確な結果が得られるでしょう。

目次