수학/기초 통계학

[통계학] 분산분석 - 등분산성 검정 - 잔차그림, Hartley 검정, Bartlett 검정

AI 꿈나무 2020. 10. 10. 10:49
반응형

 여인권 교수님의 KMOOC 강의 <통계학의 이해 2>를 수강하면서 공부한 내용을 정리해보았습니다.

 


 분산분석에서의 통계적 추론을 하는데 필요한 가정에 대해 알아보겠습니다.

 

 분산분석에서 가정한 조건을 분석자료들이 만족하는지 확인하는 방법을 알아보겠습니다.

모형 가정

 분산 분석에서 가장 중요한 것이 모형식이 등분산성을 만족하냐가 중요합니다.

 

 

 모형식이 다음과 같이 주어졌을 때

 

 1. 등분산성

 2. 정규성 - Shapiro-Wilk, jarque-bera 등등

 3. 독립성

 

 세 가지를 검정해야 합니다.

 

등분산성 검정

 등분산성 검정은 가설검정으로 구할 수 있습니다.

 

 귀무가설과 대립가설을 다음과 같이 설정합니다.

 

 

 반복수가 같은 경우 동일한 분산을 가진다는 가정을 약간 어기는 것에 대해 분산분석 방법은 robust한 편입니다. 이는 검정을 안해도 되는 것을 의미합니다.

 

 반복수가 다르거나 어떤 한 분산이 다른 분산들보다 상당히 큰 경우 분산분석 방법은 robust하지 않습니다. 이는 분산들이 같은지 다른지 확인이 필요하다는 의미입니다.

 

등분산성 검정 방법에 대해 알아보겠습니다.

 

 1. 잔차그림

 잔차그림을 이용하여 주관적으로 등분산성을 확인할 수 있습니다. 

 

 잔차들 간에는 항상 상관관계가 존재합니다.

 

 잔차(residuals)는 (각각의 관측값 - 각 그룹의 평균) 입니다.

 

 

 잔차그림은 x축에 각 그룹의 평균, y축에 각각의 잔차의 그래프입니다.

 

 

잔차 그림

 

 시각적으로 그룹간 분산이 비슷하다는 것을 확인할 수 있습니다.

 

2. Hartley 검정

 동일 반복수 n 일 때 Hartley 검정에서 검정통계량은 다음과 같습니다.

 

 

 검정통계량은 H분포를 따르게 됩니다.

 

 H분포의 값은 통계프로그램을 이용하여 구할 수 있습니다.

 

 기각역은 다음과 같이 구할 수 있습니다.

 

 

3. Bartlett 검정

 Bartlett's 검정 통계량은 정규 가정에 매우 민감하기 때문에 정규 가정이 의심스러우면 사용에 주의해야 합니다.

 

 검정정통계량은 다음과 같이 구할 수 있습니다.

 

 

 검정통계량은 카이제곱분포를 따르게 됩니다.

 

정리

 

반응형