수학/기초 통계학

[통계학] 세 모집단의 평균 비교 - 다중검정의 문제점과 분산분석의 개념

AI 꿈나무 2020. 10. 7. 11:22
반응형

 여인권 교수님의 KMOOC 강의 <통계학의 이해 2>를 수강하면서 공부한 내용을 정리해보았습니다.

 


 독립 표본을 통해 분산이 같은 세 정규 모집단의 평균 비교하는 방법을 알아보겠습니다.

 

 모든 조합에 대해 평균 차에 의한 가설검정으로 결과를 도출할 때 발생하는 문제에 대해 알아보겠습니다.

 

세 모집단 평균 비교

 두 모집단의 경우 모평균의 차를 이용했지만 세 모집단의 경우는 검정통계량을 찾기 어렵습니다.

 

 

 세 모집단의 평균 비교를 하는 방법으로 다중검정을 생각할 수 있습니다.

 

 방법 1. 모든 쌍에 대해 t-검정 => 다중 검정

 다중검정시에 유의수준 문제가 발생하게 됩니다.

 

 하지만 다중검정시에 유의수준 문제가 발생하게 됩니다.

 

 

 

 다중검정의 문제에 대해 알아보겠습니다.

 

 

 다중검정을 통해 유의수준이 도출되었을 때 본페르니의 부등식에 의해 다음과 같이 표현할 수 있습니다.

 

 

 각 가설에 대해 5% 유의수준의 검정결과를 결합하여 결론을 내는 검정의 방법의 실제 유의수준은 최대 15%가 될 수 있다는 것이 문제입니다.

 

분산분석(Analysis of Variance, ANOVA)

 분산분석은 각각의 모집단의 분산이 동일하다고 가정하였을 때 그룹 내의 분산에 비해 그룹 간의 분산이 얼마나 큰지를 비교함으로써 평균 간에 차이가 있는지를 알 수 있습니다.

 

 우선 예시로 두 모집단의 평균비교를 분산분석으로 확인해보겠습니다.

 

1. 두 모집단 평균비교(독립표본, 등분산)

 독립표본이고 등분산일 때 검정통계량은 다음과 같이 도출할 수 있습니다.

 

 

 검정통계량은 자유도가 m+n-2인 t분포로 나타낼 수 있습니다.

 

 여기서, $S_p$는 합동표본표준편차입니다.

 

 합동표본표준편차를 제곱하면 다음과 같습니다.

 

 

 합동표본표준분산은 공통 분산을 대신할 수 있습니다.

 

 이를 이용하기 위해 검정통계량도 제곱을 하겠습니다.

 

 

 이는 자유도가 누인 F분포를 따르게 됩니다. 1은 분자 추정자유도이고, m+n-2는 분모추정 자유도 입니다.

 

 분자를 풀어쓰면 검정통계량을 다음과 같이 나타낼 수 있습니다.

 

 

 

 여기서 $T_0^2$의 분모와 분자의 의미를 알아보겠습니다.

 

 $T_0^2$의 분모는 분산이 같다는 가정 하에서의 공통분산 $\sigma^2$의 추정량을 의미합니다.

 이는 각 그룹의 관측값들이 해당 그룹의 표본평균을 중심으로 얼마나 퍼져 있는지를 나타내는 통계량입니다.

 => 그룹 내에서의 분산

 

 $T_0^2$의 분자전체평균을 중심으로 각 그룹의 평균들이 얼마나 퍼져있는지를 나타내는 통계량입니다.

 => 그룹 평균 간의 분산

 

 분자는 $\overline{X} - \hat{\mu}$ 와 $\overline{X} - \hat{\mu}$ 중 하나만 알면 다른 값을 알 수 있기 때문에 자유도는 1이 됩니다.

 

 

 그룹 내의 분산에 비해 그룹 간의 분산이 얼마나 큰지를 비교함으로써 평균 간에 차이가 있는지를 알 수 있습니다.

 

2. p개의 모평균 비교

 이번에는 p개의 모평균을 비교하도록 하겠습니다.

 

 

 검정통계량은 다음과 같이 나타낼 수 있습니다.

 

 

 $F_0$의 분모는 각 모집단의 분산이 동일하다는 가정 하에서 유도된 값입니다.

 

3. 예제 문제

 결혼 연령대에 따라 부부간 신장의 평균 차 비교입니다.

 자료는 남편신장 - 부인신장 값 입니다.

 

 

 검정통계량을 도출하기 위해 세 가지 값이 필요합니다.

 

(1) 전체 평균

 

 

(2) (각 그룹의 표본평균 - 전체 평균)의 제곱

 

 

(3) (각 그룹의 관측값 - 각 그룹의 표본평균)의 제곱

 

 

 위 세가지 값을 구했으면 검정통계량을 도출할 수 있습니다. 

 

 

 검정통계량의 값이 5% 유의수준보다 크므로 귀무가설은 기각됩니다.

 

 

4. 정리

 

 

반응형