コース: データ分析の基礎知識

データ品質の重要性を理解する

コース: データ分析の基礎知識

データ品質の重要性を理解する

私は幼い頃、とても具合が悪くなり、 病院に行ったことがあります。 ひどい頭痛が2日間続いたので、 レントゲンを撮りました。 レントゲンには何も映らなかったのですが、 病気の兆候と血液検査の結果、 救急病院に送られました。 2日後、再びレントゲンを撮ったところ、 具合が悪い原因がわかりました。 細菌性の副鼻腔炎で、 なんと脳まで侵されていたのです。 11 日間入院し、 悪化を防ぐための適切な治療と、 回復のための治療を受けました。 これが、データの品質と どう関係するのでしょうか。 最初のレントゲンで、 何も映らなかったのは、 機械の故障が原因でした。 最初のレントゲンが、 2枚目と同じ結果だったら、 もっと早く回復していたでしょうか。 それはわかりません。 高品質なデータとは、 意思決定ができる正確な洞察をもたらす 信頼できるデータです。 2枚目のレントゲンを撮るのが もっと遅かったり、 そのまま家に帰されたりしていたら、 私は今ここにいないでしょう。 すべてのデータが 生死に関わるわけではありませんが、 データの品質をおろそかにすると、 企業に恐ろしい結果をもたらします。 忘れてはいけないのは、 人はデータを使って 意思決定をしており、 その質が悪ければ、 重大な結果をもたらす 誤った意思決定をする 可能性があることです。 データアナリストとして 意識すべきデータ品質の次元があります。 データ品質のすべてを 網羅したものではありませんが、 ここでは、高品質なデータの 4つの特徴を紹介します。 完全性、一貫性、有効性、正確性です。 データの完全性は、 必要なデータがすべて揃っているか、 不足がないか、そして すべて使用できるかどうかを示します。 一貫性は、データが 他のシステム上にある場合、 その情報が 一貫しているかどうかを示します。 例えば、機関システムにある記録が、 請求書発行システムに送信したものと 一致しているかどうかなどです。 有効性は、データで行おうとしていることの 要件を満たしているか、 また、その処理のために必要な 正しい形式になっているかを示します。 正確性は、 データが正確であるかどうかを示します。 非常に重要なことです。 私のケースでは、 正確ではありませんでした。 品質は、測定可能であると 知ることが重要です。 完全で、一貫性があり、有効で、 正確かどうかを判断します。 そうでないなら、 その事実を知る必要があるのです。 繰り返しますが、 生死に関わるデータもあるので、 データの質を高めることは重要です。

目次