Loading [MathJax]/jax/output/CommonHTML/jax.js

수학/기초 통계학

[통계학] 회귀추론을 위한 기본이론 - 회귀모델에서의 MSE와 중심축량

AI 꿈나무 2020. 10. 18. 06:10
반응형

 여인권 교수님의 KMOOC 강의 <통계학의 이해 2>를 수강하면서 공부한 내용을 정리해보았습니다.

 


회귀추론을 위한 기본이론

 회귀모형의 모수 또는 예측값을 추론을 위한 기본 통계이론을 정리하겠습니다.

 

1. 회귀 모형식 가정

 단순회귀모형에서 모형식은 다음과 같이 가정할 수 있습니다.

 

 

 여기서, β0+β1xi는 평균을 의미합니다.

 ϵi ~ iid N(0,σ2)는 추론할 때 필요한 가정입니다.

 

 최소제곱법에 의한 모수 추정에서는 특별히 오차항의 가정을 사용하지 않습니다.

 최소제곱법yiβ0β1xi를 이용하기 때문에 ϵi는 신경쓰지 않는다는 의미입니다.

 

 모수 추정량 또는 예측값의 성질을 유도하기 위해 오차항의 가정이 필요합니다.

 

 

 여기서 β0+β1xi 는 평균을 의미하고 평균이 매번 바뀌므로 확률분포로 표현하기 위해 ui로 표현합니다.

 

2. 표집분포

 표집분포는 통계값의 확률분포를 의미합니다.

 회귀모델에서 평균이 확률분포이므로 표본추출 값에 따라 평균이 바뀌기 때문입니다.

 

 

 독립이므로 선형결합도 독립이고 분산은 각각의 분산의 합으로 표현할 수 있습니다.

 

 이를 표준화하면 다음과 같게 됩니다.

 

 

 여기서 σ2미지의 모수이므로 추정해야 합니다.

 σ2를 추정하는 방법은 모델마다 다릅니다.

 회귀모형에서 분산을 추정하는 방법은 아래에 기술하겠습니다.

 

 

 σ2의 추정값은 ^σ2로 표현하며 이는 자유도가 v인 t분포를 따르게 됩니다.

 

3. σ2의 추정 (복습)

 σ2를 추정하는 방법을 복습해보겠습니다.

 

(1) 단일 모집단의 경우 분산은 다음과 같이 추정할 수 있습니다.

 

 

(2) 두 모집단의 평균이 다른 경우 분산은 다음과 같이 추정할 수 있습니다.

 

 

(3) 모집단이 세개 이상있을 때의 분산은 다음과 같이 추정할 수 있습니다.

 

 

4. 회귀모형

 회귀모형에서 분산은 추정하는 방법과 중심축량을 구하는 방법은 다음과 같습니다.

 

 회귀모형식

 

 

 MSE에서 분자는 (각각의 관측값 - 평균)제곱의 합으로 표현할 수 있습니다.

 

 

 SSE / 자유도 = MSE 이므로 자유도를 알면 MSE를 구할 수 있습니다.

 자유도는 오차의 두 제약조건 때문에 2개를 사용못합니다.

 

 

 따라서 회귀모형에서 MSE(분산의 추정값)는 다음과 같이 구할 수 있습니다.

 

 

 MSE(분산의 추정값)을 이용해서 중심축량을 구하면 다음과 같습니다.

 

 

 중심축량 정규분포를 따르지 않고 자유도가 n-2인 t분포를 따르게 됩니다.

 

5. MSE 계산

 

6. 정리

 회귀모형의 모수 또는 예측값을 추론하기 위한 기본 통계이론을 정리해보겠습니다.

 

 

반응형