반응형

회귀분석 5

[통계학] 잔차검진 - 정규성, 등분산성, 독립성 검진 - 잔차그림, Q-Q plot, 산점도

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 잔차검진 - Residual Diagnositics 분석에 사용된 회귀모형의 적절성과 통계적 추론의 가정을 만족하는지를 확인하는 방법에 대해 알아보겠습니다. 1. 오차항의 가정 오차항에서는 세 가지가 가정되어야 합니다. (1) 정규성 중심축량이 자유도가 n-2인 t분포를 따른다고 유도할 때 데이터가 정규분포를 만족한다고 가정하에 t분포를 유도합니다. (2) 등분산성 MSE는 모든 분산이 동일하다는 가정하에 유도합니다. 회귀분석과 분산분석에서 제일 중요한 것은 등분산성입니다. (3) 독립성 Y들이 선형 결합인 상태에서 분산을 유도하는데 이때 Y가 독립이라고 가정합니다. 이 세가지를 가정되어야 회귀분석을 할 수 있습니다. 잔차가 ..

카테고리 없음 2020.10.19

[통계학] 회귀분석 - 새로운 관측값에 대한 예측 - 중심축량과 예측구간

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 새로운 관측값에 대한 예측 새로운 설명변수(x)에 대한 예측값에 대한 추정과 예측구간을 알아보겠습니다. 저번 포스팅에서는 $x_k$일 때, $y_k$의 평균의 예측값을 공부했습니다. 평균의 예측값을 구할 때는 관심이 $b_0 + b_1x_k$에 관심이 있었지만 새로운 관측값에 대한 예측은 오차까지 고려한 $b_0 + b_1x_k + \epsilon_k$에 관심이 있습니다. 1. 새로운 $x_*$에 대한 예측값 $Y_*$의 추론 $\hat{Y_*}$에 관심이 있으면 $\hat{b_0} + \hat{b_1}x_*$를 이용해도 되지만 $\epsilon_*$에 관심이 있으면 예측오차 $\hat{Y_*} - Y_*$에 관심을 가져야 합..

[통계학] 회귀분석 - 예측값 평균에 대한 통계적 추론 - 중심축량, 신뢰구간

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 예측값 평균에 대한 통계적 추론 예측값의 평균, E(Y) = $b_0$ + $b_1x$를 추론하기 위한 중심축량과 예측구간을 알아보겠습니다. 1. 반응변수 기댓값 E($Y_k$)에 대한 추론 주의할 점은 $Y_k$를 직접 추론하는 것이 아니라 E($Y_k$)를 추론하는 것입니다. 점추정량의 성질에 대해 알아보겠습니다. 점추정량을 Y들의 선형 결합으로 나타낼 수 있습니다. 이는 정규분포를 따른다는 것을 의미합니다. 추정된 예측값 평균은 다음과 같이 표시할 수 있습니다. 분산은 다음과 같습니다. 이는 $x_k$가 $\overline{x}$에서 멀어질수록 분산이 커진다는 것을 의미합니다. 평균과 분산을 구했으므로 $\hat{Y_k}..

[통계학] 회귀분석 - 회귀계수(절편)에 대한 통계적 추론 - 절편의 중심축량과 구간추정

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 절편 $\beta_0$ 에 대한 통계적 추론 회귀계수 중 절편에 해당하는 $\beta_0$의 중심축량과 구간추정에 대해 알아보겠습니다. 1. $\hat{\beta_0} = \overline{Y} - \hat{\beta_1}\overline{x}$의 역할 x가 0일 때 E(Y)의 값이 $\beta_0$ 입니다. 최소제곱법 추정으로 $\beta_0$ 추정과정을 알아보겠습니다. D를 $b_0$으로 미분함으로써 최소로하는 $b_1$과 $b_0$을 찾습니다. 추정한 $b_1, b_0$를 $\hat{b_1}, $\hat{b_0}$으로 표현합니다. $\beta_0$가 없는 모형에서의 잔차 합은 0이 되지 않을 수 있습니다. $b_0$이 0..

[통계학] 회귀분석 - 회귀계수(기울기)에 대한 통계적 추론 - MSE, 구간추정, 가설검정, 검정통계량

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 회귀계수(기울기)에 대한 통계적 추론 회귀계수 중 기울기에 해당하는 $\beta_1$의 중심축량, 구간추정, 가설검정에 대해 알아보겠습니다. 1. 기울기 $\beta_1$에 대한 추론 $\hat{\beta_1}$은 $\beta_1$의 추정값입니다. $\hat{\beta_1} = S_{xY}/S_{xx}$의 통계적 성질은 다음과 같습니다. $\hat{\beta_1}$의 기댓값은 다음과 같이 구할 수 있습니다. $\hat{\beta_1}$의 분산은 다음과 같습니다. $\hat{\beta_1}$의 기댓값과 분산을 구했으므로 $\hat{\beta_1}$는 다음과 같이 가정할 수 있습니다. 이를 표준화하면 중심축량을 구할 수 있습니다...

반응형