반응형

산점도 3

[통계학] 다변량 자료 - 산점도와 상관분석 - 표준상관계수, 상관분석 예제

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 수치변수들 간의 관계를 간단히 알아보는 방법을 알아보겠습니다. 회귀 분석을 공부하기 전에 다변량 자료가 무엇인지 복습을 해보도록 하겠습니다. 다변량 자료 - Multivariate Data 다변량 자료는 어떤 대상에 대해 여러 가지 변수들을 관측(측정)한 자료들의 집함을 의미합니다 예) 신체검사 자료에서 연령, 성별, 신장, 체중 시력, 혈액형 등등 자료의 형태를 보면 변수가 여러개 인것을 확인할 수 있습니다. 이를 다변량 자료라고 합니다. 변수가 하나면 일변량 자료 입니다. 각각의 관측값 간에는 관력성이 없습니다. 이는 독립적인 관측값을 의미합니다. 다음에 배울 회귀 분석에서는 독립적인 관측값을 가정합니다. 다변량 자료에서의..

[통계학] 03-3. 다변량 자료 기술통계 (3) - 공분산, 상관계수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 이번 포스팅에서는 두 수치자료의 직선관계의 정도를 타나내는 통계값(공분산, 상관계수)을 알아보겠습니다. 5. 공분산 - covariance 공분산(covariance)은 두 수치변수 간에 직선관계가 어느 정도인지를 나타내는 통계값입니다. 두 수치형 변수 간에 관계가 있는지는 산점도를 통해 시각적으로 확인할 수 있으나 수치적 측도를 통해 그 관계가 어느 정도 되는지를 알아볼 때 이용됩니다. 공분산을 알아보기 위해 양의 기울기와 음의 기울기를 가지는 산점도를 살펴보겠습니다. 위의 산점도는 ($\overline{x}$, $\overline{y}$)를 중심으로 1과 3사분면은 양..

[통계학] 03-2. 다변량 자료 기술통계 (2) - 비교그림, 산점도, 산점도 행렬, 시계열 그림

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 표나 그래프를 이용하여 수치자료를 그룹별로 나누어 비교하는 방법을 알아보겠습니다. 두 수치자료의 관계를 나타내거나 하나는 범주형, 하나는 수치형 자료를 이용하는 표나 그래프를 알아보겠습니다. 4. 비교그림 (1) 표를 이용한 비교 자료구조와 분석목적에 따라 목적에 맞는 표를 만들 수 있습니다. 구조로는 분류자료(그룹, 범주) + 수치자료로 구성되어 있는 표를 알아보겠습니다. 목적으로는 그룹 간 비교입니다. 이를 위해 수치자료의 특성을 나타내는 값을 그룹별로 정리하여야 합니다. 예를 들어 표본크기, 평균, 표준편차 등으로 그룹을 나누는 경우가 있습니다. 이를 정당별 당선자 ..

반응형