표본 분포
표본 분포(sampling distribution 또는 finite-sample distribution) 또는 표집분포는 크기 n의 확률 표본(random sample)의 확률 변수(random variable)의 분포(distribution)이다. 하나의 표본으로부터 계산된 통계량(statistic)은 여러가지가 있을 수 있으나 평균을 가장 많이 사용하므로 아래에서 평균을 사용한 표본 분포를 대표적으로 기술한다.
표본 평균의 분포
[편집]모집단에서 임의로 추출된 표본의 평균을 표본 평균이라고 하며 표본 평균도 그 값이 변하는 확률 변수인데 그 확률 분포를 표본 평균의 분포라고한다. 이 확률 분포로부터 표본 평균()들 간의 평균과 분산도 구할 수 있다. 이 분포에 대해 일반적으로 다음과 같은 사실이 알려지고 있다. 정규 분포 를 하는 모집단으로부터의 크기 인 임의표본의 평균 의 분포에 대하여
- [1] ,
- [2] 의 분포는 이다.
- [3] 모집단이 정규분포하지 않아도 이 충분히 크면 위의 사실이 근사적으로 성립한다.
이것이 중심 극한 정리의 주요한 부분이며 이 정리에 의하면 모집단이 정규 분포를 따르지 않아도 이 분포는 정규 분포를 따른다. 이 것을 이용해 통계적 추론을 하게 된다. 표준 오차는 이 분포의 표준 편차이다.
이항 분포의 경우는 는 이 충분히 커질 때(보통 일 때), 로 근사할 수 있다.
표집분포
[편집]특히 표집 분포(sampling distribution)은 연구 대상이 되는 모집단에서 다중 복수의 표본들을 추출한 자료들을 통해서 통계적 가설을 검증할 때 필요한 분포이다. 따라서 모집단으로부터의 충분한 여러 표집(sampling)에서 얻게되는 표본들의 표본평균들은 표집분포를 갖게되고 이 표집분포는 모집단의 분포에 수렴한다. 이러한 중심극한정리(cetral limit theorem)에서 표집분포의 평균값()은 모집단의 평균값()에 근사하게 된다.
표준오차
[편집]표집오차(sampling error)는 모집단의 표준편차에 근사한다.
같이 보기
[편집]각주
[편집]외부 링크
[편집]- 라이스대학 통계학시뮬레이션페이지 (BEGIN버튼을 눌러 볼 것)
이 글은 통계학에 관한 토막글입니다. 여러분의 지식으로 알차게 문서를 완성해 갑시다. |