コース: 統計学の基礎:データセットの利用

今すぐコースを受講しましょう

今すぐ登録して、23,100件以上登録されている、業界エキスパート指導のコースを受講しましょう。

第一種過誤と第二種過誤

第一種過誤と第二種過誤

これまで仮説検定では、 毎回帰無仮説と対立仮説を立ててきました。 帰無仮説は通常、 現状が続くことを仮定します。 たとえば、システムが機能していることや、 システム上何も変化がない、 といったことです。 対立仮説はその反対です。 対立仮説は、 システムが機能していないことや、 何か変化が起きていることを仮定します。 例として、特殊なタイプの がん検診を見てみましょう。 この架空の検診では血液検査を もとに結果を通知します。 平均値は 100 です。 数値が 125 を超える場合、 陽性となります。 つまり、がんであるということです。 これについて仮説検定をおこなうと、 がん検診には2つの仮説があると言えます。 帰無仮説では、 何も問題がないと仮定します。 検診を受けた人には がんがないということです。 一方、対立仮説は検診を受けた人に がんが見つかったということになります。 アルファを 0.02 または 2%とします。 そして、がんの発生率が 正規分布に従うとしましょう。 これを正規分布のグラフで見ると、 平均値が 100 となり、 125 より右側になると、 がん検診の結果が陽性 ということになります。 この場合、帰無仮説はがんではない ということになり、 125 より左側では 帰無仮説を棄却しません。 検診の結果はがんではない ということになります。 一方で、125 より右側では、 帰無仮説を棄却します。 検診結果は、患者にがんが 見つかったということを意味します。 でも、がん検診は完璧ではありません。 アルファは2%です。 つまり、数値が 125 以上で、 検査が陽性であっても、 がんではない可能性があります。 確率は低いですが、 まったくないわけではありません。 これを偽陽性と呼びます。 これは1つのエラーですが、 もう1つ違う種類のエラーがあります。 125 未満の数値、 つまり結果が陰性であっても、 実際にはがんである場合があります。 これを偽陰性と言います。 統計学者はよく、 このような表を使用して、 結果を理解しようとします。 上のほうが事実です。 検診を受けた人の中には がんがない人もいます。 がんがある人もいます。 帰無仮説において、がんがない、 ということは帰無仮説と 一致するということです。 がんがあるということは 帰無仮説に反します。…

目次