반응형

회귀모형 4

[통계학] 회귀추론을 위한 기본이론 - 회귀모델에서의 MSE와 중심축량

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 회귀추론을 위한 기본이론 회귀모형의 모수 또는 예측값을 추론을 위한 기본 통계이론을 정리하겠습니다. 1. 회귀 모형식 가정 단순회귀모형에서 모형식은 다음과 같이 가정할 수 있습니다. 여기서, $\beta_0 + \beta_1x_i$는 평균을 의미합니다. $\epsilon_i$ ~ iid N(0,$\sigma^2$)는 추론할 때 필요한 가정입니다. 최소제곱법에 의한 모수 추정에서는 특별히 오차항의 가정을 사용하지 않습니다. 최소제곱법은 $y_i - \beta_0 - \beta_1x_i$를 이용하기 때문에 $\epsilon_i$는 신경쓰지 않는다는 의미입니다. 모수 추정량 또는 예측값의 성질을 유도하기 위해 오차항의 가정이 필요합..

[통계학] 단순선형회귀모형에서의 모수 추정 - 기울기와 절편, 최소제곱법, 최소절대편차법

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 단순선형회귀모형에서의 모수 추정 설명변수가 하나인 회귀모형에서 관측값과 회귀선과의 거리를 어떻게 표시하는지 알아보겠습니다. 최소제곱법을 이용한 회귀모수를 추정하는 방법을 알아보겠습니다. 1. 단순선형회귀모형 - Simple Linear Regression Model 단순선형회귀모형은 설명변수가 하나인 선형회귀모형을 의미합니다. 회귀모형 중에서 가장 간단한 형태입니다. $x_i$를 소문자로 쓴 이유는 상수로 가정하기 때문입니다. 또한 $Y_i$ ~ iidN(0,$\sigma^2$)를 가정합니다. $\epsilon$은 오차(error)를 의미하며 모형에서 설명이 안되는 부분입니다. 설명변수(x)는 조절 가능한 상수로 가정합니다. ..

[통계학] 회귀분석 - 회귀모형 개념 - 선형회귀모형

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 저번 포스팅에서는 다변량 자료의 관계를 파악하는 방법인 산점도와 상관분석에 대해 공부해보았습니다. 이번에는 수치변수들 간 인과관계를 설명하기 위한 대표적인 통계모형인 회귀모형을 알아보겠습니다. 다변량 자료에서 주요 관심사 다변량 자료에서 주요 관심사는 변수들 간의 관계입니다. 1. 산점도와 상관분석으로 분석 가능한 관심사 (1) 변수들 간 관계가 있는가? (2) 있다면 어떤 관계가 있는가? (3) 관계가 어느 정도 되는가? 위 세 개의 관심사는 산점도와 상관분석을 통해 직선관계를 파악하여 분석할 수 있습니다. 산점도와 상관분석은 직선관계만 파악할 수 있습니다. 2. 회귀모형으로 분석 가능한 관심사 (1) 관계를 식으로 표시할 ..

[통계학] 다변량 자료 - 산점도와 상관분석 - 표준상관계수, 상관분석 예제

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 수치변수들 간의 관계를 간단히 알아보는 방법을 알아보겠습니다. 회귀 분석을 공부하기 전에 다변량 자료가 무엇인지 복습을 해보도록 하겠습니다. 다변량 자료 - Multivariate Data 다변량 자료는 어떤 대상에 대해 여러 가지 변수들을 관측(측정)한 자료들의 집함을 의미합니다 예) 신체검사 자료에서 연령, 성별, 신장, 체중 시력, 혈액형 등등 자료의 형태를 보면 변수가 여러개 인것을 확인할 수 있습니다. 이를 다변량 자료라고 합니다. 변수가 하나면 일변량 자료 입니다. 각각의 관측값 간에는 관력성이 없습니다. 이는 독립적인 관측값을 의미합니다. 다음에 배울 회귀 분석에서는 독립적인 관측값을 가정합니다. 다변량 자료에서의..

반응형