(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다.
(k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다.
시행횟수가 많은 경우 이항분포의 확률을 정규근사로 계산하는 원리에 대해 알아보겠습니다.
이를 통해 비율에 대한 통계적 추론의 이론적 근거를 마련합니다.
1. 이항분포의 정규근사
X ~ B(n,p), n이 크고
p가 작은 경우 => 포아송 근사
p가 큰 경우 => 포아송 근사
p가 0.5에서 많이 벗어나지 않은 경우 => 정규근사를 이용합니다.
Xi를 i번째 시행에서의 베르누이 확률변수 라고 하면 다음과 같이 표시할 수 있습니다.
X=X1+X2+...+Xn,P=X1+X2+...+Xnn
또한 베르누이 확률변수의 평균과 분산은 각각 E(Xi)=p, Var(Xi)=p(1−p)입니다.
표본비율 ˆp=X/n=¯X 라고 한다면 기대값과 분산은 다음과 같이 표시할 수 있습니다.
$$E(\hat{p}) = p, Var(\hat{p}) = Var(X)/n^2 = \frac{p(1-p)}{n}$$
n이 크다면 중심극한정리를 이용하여 아래와 같이 표현할 수 있습니다.
$$\hat{p} \cong N(p, \frac{p(1 - p)}{n})$$
위 식을 표준화 하면 다음과 같은 결과가 도출됩니다.

2. 연속성 수정 - Continuity correction
이항확률변수 X의 경우, x = 0, 1, ... , n에 대해 다음과 같은 관계가 성립합니다.

이처럼 모순이 발생하는데 이러한 문제점을 해결하기 위해서는 X의 확률을 계산할 때 등호 포함여부에 따라 확률의 영역을 수정해 주어야 합니다.
P(X<x)=>P(X<x+1/2)
P(X≤x)=>P(X≤x−1/2)
P(X≥x)=>P(X≥x−1/2)
P(X>x)=>P(X>x+1/2)
로 수정해저 정규근사확률을 구합니다.


3. 예시문제
전체 국민 중 60%가 A 정책에 찬성한다고 주장합니다.
150명을 무작위로 뽑아 찬성하는 사람의 비율을 알아보려고 할 때 적극 찬성하는 사람이 78명 이하일 확률은?

이상으로 이항분포의 정규근사에 대해 알아보았습니다. 감사합니다.
'수학 > 기초 통계학' 카테고리의 다른 글
[통계학] 17. 추정법과 점추정량 - 적률법, 최대가능도추정법, 일치성, 비편향성, 효율성 (0) | 2020.09.22 |
---|---|
[통계학] 16. 통계적 추론의 종류 - 모수적 추론, 비모수적 추론, 점추정, 구간추정, 가설검정, 베이즈안 추론 (0) | 2020.09.22 |
[통계학] 14. 중심극한정리 (0) | 2020.09.21 |
[통계학] 13. 표집분포 (0) | 2020.09.21 |
[통계학] 12. 확률표본과 통계량 (0) | 2020.09.21 |