반응형

범주화 2

[통계학] 03-1. 다변량 자료 기술통계 (1) - 분할표, k차원 분할표, 원도표, 막대그래프

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 다변량 범주형 자료를 표나 그래프를 이용하여 정리하는 방법을 알아보겠습니다. 다변량 변수(형태)는 다음으로 분류할 수 있습니다. 이를 분석 목적에 따라 다양한 표나 그래프를 선정해야 합니다. 비교 : X에 따라 Y에 차이가 있는가? (1번과 2번, 비율, 빈도, 분산, 평균 등) 관계 : X와 Y가 관련이 있는가?, X가 Y에 영향을 주는가? (1번, 4번) 분류 : X에 따라 Y를 분류할 수 있는가?, X와 Y가 비슷한 것끼리 묶을 수 있는가? 이제부터 다변량 변수를 정리하는 표나 그래프에 대해 알아보겠습니다. 1. 분할표 - contingency table 앞에서 배운..

[통계학] 02-3. 기술통계 (3) - 수치형 자료 정리(도수분포표, 점도표, 히스토그램, 줄기-잎 그림)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 수치자료를 범주화하는 방법을 알아보겠습니다. 또, 범주화된 수치자료를 표나 그래프를 이용하여 정리하는 방법을 알아보겠습니다. 4. 표를 이용한 정리(수치형) 4.1 도수분포표 - frequency table 수치자료에 대한 도수분포표를 만들 때에는 관측된 값들을 몇 개의 구간으로 범주화하여 해당 그룹에 속한 관측개체의 빈도로 도수분포표를 만듭니다. 우선, 수치자료의 범주화를 알아보겠습니다. 수치자료를 범주화할 때는 몇 개의 범주로 나눌 것인지와 범주의 경계값을 얼마로 할 것인지 정해야 합니다. 자료의 특성을 고려해 분석자가 임의대로 결정할 수 있습니다. 계급(class) ..

반응형