コース: データ分析の基礎知識

身の回りに存在するデータを知る

コース: データ分析の基礎知識

身の回りに存在するデータを知る

一人の人間の周りには、 想像以上に大量のデータがあります。 生年月日、名前といったデータや、 社員 ID、 肩書き、入社日、部署などの 業務データがあります。 これらは、人に関わるデータを扱う際に 検討する項目です。 この中には、生年月日のように、 それ自体がひとつの値で、 普遍なものもあります。 また、肩書きのように、 職場で昇進すると、 変わる項目もあります。 常時発生する リアルタイムデータもあります。 心拍数や血糖値、血圧、体温などです。 位置情報のような地図データもあります。 また、フォローや購入をしている ブランド、宅配や外食の頻度など、 ソーシャルデータも思い浮かべてください。 データは常に発生しています。 データアナリストの課題は、 大量の潜在的データを 全部は使えない点です。 また、同じデータの多くが 重複していたり、 不正確であったりさえします。 データに関しては、 誰もが真実を語る唯一の資料を求めており、 報告の際には、 正確であることを望みます。 例えば、企業にはさまざまな情報を 扱う複数のソフトウェアパッケージがあり、 しばしば、連携がうまくいっていません。 従業員データは、人事情報を扱う 人材管理ソフトで処理されます。 マーケティングと販売管理のデータは、 別々のシステムに入っていて、 販売関連のスタッフ情報だけでなく、 顧客情報も扱います。 また、販売チームの営業により、 顧客が商品の購入を決めた際に、 利用を開始するソフトウェアもあります。 そのデータは、購買から倉庫に流れます。 損益報告などに向けた処理のため、 会計チームに流れるデータもあります。 つまり、データは組織内を 異なるタイミングで流れ、 システム間も分断されているのです。 最初の課題のひとつは、 最も正確な情報があるシステムを 見つけることです。 本当に知るには、調査を始め、 その過程で疑問を持つしかありません。 データの権限や機密性の問題で、 障がいにぶつかることもあります。 例えば、数値確認に必要なデータが 会計ソフトにあり、 会計チームのみがアクセスできます。 ただ、直接アクセスできないからといって、 これで終わりではありません。 数値を提供すれば、 チームが検証を手伝ってくれます。 実際には、システム同士が 連携しているかどうかに関わらず、 同じ情報を記録しているはずです。 もし販売チームが 今月 10 万ドルの請求書を発行すると 報告すれば、 会計ソフトには、!0 万ドル分の 請求書が反映されるはずです。 帳尻が合わない場合は、 どこで問題が発生したかを 突きとめなければなりません。 データアナリストは、 どのようなデータを見つけられるか確認し、 アクセスできるデータを探し出し、 報告の正当性を示す戦略を立てる 必要があります。 覚えていてください。 データは、あらゆるもので姿を現しますが、 それを正確にまとめるのが 私たちの仕事なのです。

目次