반응형

다변량 자료 기술통계 2

[통계학] 03-3. 다변량 자료 기술통계 (3) - 공분산, 상관계수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 이번 포스팅에서는 두 수치자료의 직선관계의 정도를 타나내는 통계값(공분산, 상관계수)을 알아보겠습니다. 5. 공분산 - covariance 공분산(covariance)은 두 수치변수 간에 직선관계가 어느 정도인지를 나타내는 통계값입니다. 두 수치형 변수 간에 관계가 있는지는 산점도를 통해 시각적으로 확인할 수 있으나 수치적 측도를 통해 그 관계가 어느 정도 되는지를 알아볼 때 이용됩니다. 공분산을 알아보기 위해 양의 기울기와 음의 기울기를 가지는 산점도를 살펴보겠습니다. 위의 산점도는 ($\overline{x}$, $\overline{y}$)를 중심으로 1과 3사분면은 양..

[통계학] 03-1. 다변량 자료 기술통계 (1) - 분할표, k차원 분할표, 원도표, 막대그래프

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 다변량 범주형 자료를 표나 그래프를 이용하여 정리하는 방법을 알아보겠습니다. 다변량 변수(형태)는 다음으로 분류할 수 있습니다. 이를 분석 목적에 따라 다양한 표나 그래프를 선정해야 합니다. 비교 : X에 따라 Y에 차이가 있는가? (1번과 2번, 비율, 빈도, 분산, 평균 등) 관계 : X와 Y가 관련이 있는가?, X가 Y에 영향을 주는가? (1번, 4번) 분류 : X에 따라 Y를 분류할 수 있는가?, X와 Y가 비슷한 것끼리 묶을 수 있는가? 이제부터 다변량 변수를 정리하는 표나 그래프에 대해 알아보겠습니다. 1. 분할표 - contingency table 앞에서 배운..

반응형