수학/기초 통계학

[통계학] 18. 구간추정과 신뢰구간

AI 꿈나무 2020. 9. 22. 21:41
반응형

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다.

 


 

 구간추정의 주요개념과 과정을 알아보겠습니다.

 


1. 구간 추정

 구간추정은 미지의 모수가 포함될 것으로 기대하는 범위를 확률적으로 택하는 과정입니다.

 

 관심모수가 $\phi$라고 하면 구간추정에서는 아래 식과 같이 $\phi$를 포함할 확률이 1-$\alpha$인 구간 [L, U]를 구합니다.

$$P(L < \phi < U) = 1 - \alpha$$

 여기서 [L, U]를 신뢰구간(confidence interval)이라고 합니다.

 L과 U는 확률변수로 이를 유도하는데 점추정량이 중심적 역할을 합니다.

 또한 100(1-$\alpha$)%를 신뢰수준(confidence level)이라고 합니다.

 

2. 모평균 $\mu$에 대한 95% 신뢰구간

 모집단을 $N(\mu, \sigma^2)$로 가정하고 $\sigma^2$를 알고 있다고 하겠습니다.

 표본추출하면 $X_1, X_2, ... , X_n$ ~ iid $N(\mu, \sigma^2)$ 입니다.

 $\mu$의 점추정량은 $\overline{X}$ 입니다.

 $\overline{X}$를 표준화하면 다음과 같습니다.

 여기서 Z는 모수와 통계량으로 이루어져 있고 분포는 미지수를 포함하지 않습니다.

 Z를 중심축량(pivotal quantity, 주축량)이라고 합니다.

 

 모평균 $\mu$에 대한 95% 신뢰구간을 구해보겠습니다.

 

 95% 신뢰구간에서 -1.96과 1.96 대신 확률을 만족시키는 다른 값을 사용할 수 있습니다.

 

 

3. 예시문제

 파이에 포함된 칼로리의 모평균

 파이의 칼로리는 표준편차가 8인 정규분포를 따른다고 가정하겠습니다.

 16개의 파이를 무작위로 조사했을 때 표본평균(kcal)이 $\overline{x}$=162.7이면 모평균의 95% 신뢰구간은 다음과 같이 구할 수 있습니다.

 

 위의 구간 (158.78, 166.62) 사이에 모평균이 있을 확률은 0.95인가? 아닙니다.

 여기서 L과 U는 확률변수이지만 $\mu$는 상수이므로 판단할 수 없습니다.

 베이지안 추론인 경우에는 $\mu$를 확률변수로 취급하므로 맞다고 할 수 있습니다.

 또한 이를 빈도론자(frequentist) 관점에서 보도록 하겠습니다. 

 이는 표본추출을 하여 $\overline{X_i}$를 100번 만들었을 때 95%는 표본공간이 신뢰구간에 포함하고 5%는 포함하지 않는것을 의미합니다.

신뢰구간의 이해

 

4. 정리

 

반응형