(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다.
(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다.
1. 통계학이란?
관심대상인 모집단 1에서 표본을 추출하여 표본의 성질을 도출 한뒤에 통계적 추론으로 모집단 2라는 가상의 대상을 만듭니다.
모집단 1과 모집단 2를 최대한 비슷하게 만드는 것이 중요합니다.
2. 통계적 추론 - Statistical inference
통계적 추론은 모집단에서 추출된 표본을 이용하여 모집단의 특성 또는 모수에 대해 추측하거나 특성에 대한 가설의 옳고 그름을 결정하는 과정을 의미합니다.
3. 통계적 추론의 종류
(1) 모집단에 대한 가정 여부에 따른 통계적 추론의 분류
a. 모수적 추론(parametric inference)
b. 비모수적 방법
(2) 모수처리 방식에 따른 통계적 추론의 분류
a. Frequentiest(빈도론자)
b. Bayesian(베이지안)
(3) 추론목적에 따른 통계적 추론의 분류
a. 추정
b. 가설검정
4. 분포가정유무에 따른 통계적 추론 분류
(1) 모수적 추론(parametric inference)
모집단에 특정 분포를 가정하고 분포의 특성을 결정하는 모수에 대해 추론하는 방법입니다.
예를 들어, "모집단은 평균이 $\mu$이고 분산이 $\sigma^2$인 정규분포이다"라고 가정하는 경우입니다.
모수 공간(parameter space)은 다음과 같이 표현합니다.
$\theta = ${$(\mu, \sigma^2)\mid -\infty < \mu < \infty, \sigma^2 > 0$}
모집단에 대한 가정이 얼마나 적절한지에 따라 최종 결론의 타당성에 영향을 줍니다.
따라서 가정의 적절성을 평가하는 부분이 있습니다. (이항분포를 이용할 때에는 각 실험이 독립적이고 성공확률이 동일한지 등의 가정을 확인해야 합니다.)
(2) 비모수적 추론(non-parametric inference)
모집단에 대해 특정 분포가정을 하지 않습니다.
주로 이상점이 있는 경우 이용합니다.
모집단의 특성을 몇 개의 모수로 결정하기가 어렵습니다.
수 많은 모수가 필요할 수 있기 때문입니다.
이론적으로 모수 공간의 차원은 $dim (\theta) = \infty$로 표시합니다.
다양한 형태의 통계량들을 고려할 수 있고 이들 통계량의 성질을 유도하고 이를 기반으로 통계적 추론을 실시합니다.
하지만 이는 유도과정이 어려운 경우가 많습니다.
대표적인 방법으로 자료의 순위(rank)를 사용합니다.
5. 모수처리방식에 따른 통계적 추론 분류
(1) Frequentist(빈도론자) inference
n이 커지면 표본이 모수로 수렴한다는 것 입니다.
$P(H) = \theta$ <= $\lim_{n \rightarrow \infty} \frac{(H)}{n}$
(2) 베이지안 추론(Bayesian inference)
베이지안 관점에서 미지의 값을 확률변수로 취급합니다. 미지의값은 모수, 결측값, 미래값 등을 의미합니다.
확률변수의 확률분포에 대해 관심을 갖습니다.
예를 들어 $\theta$가 관심모수, $x_1, x_2, ... , x_n$을 표본 관측값 일때 관심분포는 $f(\theta \mid x_1, x_2, ... , x_n)$로 나타냅니다.
표본을 얻는 과정을 다음과 같습니다.
$X_1, X_2, ... , X_n$ ~ iid $f_{\theta}$ => $f(x_1, x_2, ... , x_n \mid \theta)$ : 확률질량(밀도)함수
베이즈 정리는 $f(x \mid \theta)$ 가 아닌 $f(\theta \mid x)$에 관심을 갖는 것 입니다.
6. 추론 목적에 따른 통계적 추론
(1) 추정(estimation)
a. 점추정(point estimation) : 모수의 값이 얼마인지 알아봅니다
b. 구간추정(interval estimation) : 모수를 포함할 것으로 기대되는 구간을 확률적으로 구합니다.
(2) 가설검정(testing hypotheses)
모수에 대한 가설을 세우고 그 가설의 옳고 그름을 확률적으로 판정하는 방법론입니다.
7. 정리
'수학 > 기초 통계학' 카테고리의 다른 글
[통계학] 18. 구간추정과 신뢰구간 (0) | 2020.09.22 |
---|---|
[통계학] 17. 추정법과 점추정량 - 적률법, 최대가능도추정법, 일치성, 비편향성, 효율성 (0) | 2020.09.22 |
[통계학] 15. 이항분포의 정규근사 (1) | 2020.09.21 |
[통계학] 14. 중심극한정리 (0) | 2020.09.21 |
[통계학] 13. 표집분포 (0) | 2020.09.21 |