コース: 統計学の基礎:データセットの利用

今すぐコースを受講しましょう

今すぐ登録して、23,100件以上登録されている、業界エキスパート指導のコースを受講しましょう。

信頼区間の基礎

信頼区間の基礎

中心極限定理により、 複数の単純無作為サンプルを使うことで 母平均に近い近似値を得られることが 分かりました。 また、サンプルサイズが大きいほど、 分布の標準偏差が小さくなり、 母平均の推定値により確信を 持つことができます。 つまり、サンプルサイズが大きいほど、 そして、サンプル数が多いほど いいということです。 ですが、この章では、別の見方をし、 たった1つの無作為サンプルが持つ 力について解説したいと思います。 今回は、信頼区間について見ていきます。 この章で得られる結果は 次のようなものです。 「アメリカの平均的な成人の 飲み物摂取量が1日2、3リットルの 間であるということに 95%の確信を持てる」 これが素晴らしい点です。 この統計学者はたった1つの 単純無作為サンプルから、下限と上限までの 範囲を示す信頼区間を設定したのです。 この例では、範囲は2リットルから 3リットルの間で、この統計学者は その区間に信頼度を割り当てました。 つまり、この区間を設定した 統計学者はアメリカの成人の母平均が 2リットルから3リットルである ということに95%の確信を 持っているということです。 これがどれだけ大きな意味があるか 考えてみてください。 たった1つの単純無作為サンプルにより、 95%の信頼度でその区間が母平均を 含んでいると確信できるのです。 非常に効率的と言えますが、 次に移る前に、95%の信頼度が 何を意味しているか考えてみましょう。 仮に単一の単純無作為サンプルではなく、 20 個のサンプルを取って、 それぞれに 95%の信頼区間を 設定するとします。 そうすると、 20 個の 95%の信頼区間が得られます。 その信頼区間のうち 95%、 または 19 個が実際の母平均を含んでおり、 5%、または1つの信頼区間が 実際の母平均を含んでいないものと 予測できます。 つまり、たった1つのサンプルでも 設定した信頼区間にはかなりの自信が 持てるのです。 信頼区間により、 たった1つの単純無作為サンプルから 非常に重要な情報が得られるのです。 それでは、信頼区間について、 その設定方法や、そこから統計学者が得られる 知見について見ていきましょう。

目次