반응형

산포 2

[통계학] 02-7. 기술통계 (7) - 수치자료 분포의 산포2 (표본분산, 표본표준편차, 표준화, 변동계수)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 자료들 간의 거리를 이용하여 산포도를 계산하는 방법(표본분산, 표본표준편차)을 알아보겠습니다. 자료분석에서 측정 단위에 영향을 받지 않게 만드는 표준화에 대해 알아보겠습니다. 그리고 평균으로 표본표준편차를 보정한 변동계수를 알아보겠습니다. (3) 표본분산과 표본표준편차 범위나 사분위수범위의 경우 특정 위치의 두 값을 이용하기 때문에 표본의 정보를 많이 활용하지 못합니다. 이런 문제를 해결하기 위해 모든 자료들 간의 거리의 합을 이용하는 것 입니다. 수학적으로 거리 $D$는 임의의 점 a, b, c에 대해 다음과 같은 성질을 만족합니다. 우리는 거리$D$의 성질 중 $D$(..

[통계학] 02-6. 기술통계 (6) - 수치자표 분포의 산포1 (범위, 사분위범위, 상자그림)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 수치자료의 퍼져있는 정도인 산포도를 나타내는 값 중 두 특정 위치의 정보를 활용한 통계값(범위, 사분위 범위)을 알아보겠습니다. 자료의 주요 위치를 파악하고 이상점 유무를 확인하는 데 사용되는 상자그림에 대해 알아보겠습니다. 7.2 산포 - dispersion, 퍼짐 대부분의 경우 중심위치만으로 자료의 특성을 파악하기에는 한계가 있습니다.. 중심위치만큼 중요한 통계값이 산포입니다. 산포는 자료들이 얼마나 퍼져 있는지를 나타내는 측도이며, 중심위치가 얼마나 안정적인지에 대한 중요한 정보를 제공합니다. 자료가 조밀하게 모여 있는 경우 중심위치(평균)의 변동성이 작아져 신뢰도는..

반응형