반응형

공분산 2

[통계학] 08-3. 확률벡터(3) - 기댓값, 공분산, 상관계수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 두 개 이상의 확률변수에 대한 기댓값 계산 방법을 알아보겠습니다. 두 변수의 직선관계 정도를 나타내는 공분산과 상관계수를 계산하고 독립일 때 이들 값이 0인 것을 보입니다. 두 변수의 선형결합과 관련된 평균과 분산의 성질에 대해 알아보겠습니다. 1. 기댓값 - expected value 두 확률변수 $X$와 $Y$에 대해 $X + Y$나 $XY$의 기댓값은 어떻게 계산해야 할까? 기댓값은 확률변수가 가질 수 있는 값에 해당 확률을 곱하여 다 더한 것으로 정의 했습니다. 두 확률변수의 기댓값은 이들 변수가 가질 수 있는 값에 해당 확률, 즉 결합확률질량함수를 ..

[통계학] 03-3. 다변량 자료 기술통계 (3) - 공분산, 상관계수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 이번 포스팅에서는 두 수치자료의 직선관계의 정도를 타나내는 통계값(공분산, 상관계수)을 알아보겠습니다. 5. 공분산 - covariance 공분산(covariance)은 두 수치변수 간에 직선관계가 어느 정도인지를 나타내는 통계값입니다. 두 수치형 변수 간에 관계가 있는지는 산점도를 통해 시각적으로 확인할 수 있으나 수치적 측도를 통해 그 관계가 어느 정도 되는지를 알아볼 때 이용됩니다. 공분산을 알아보기 위해 양의 기울기와 음의 기울기를 가지는 산점도를 살펴보겠습니다. 위의 산점도는 ($\overline{x}$, $\overline{y}$)를 중심으로 1과 3사분면은 양..

반응형