반응형

기술통계 5

[통계학] 02-7. 기술통계 (7) - 수치자료 분포의 산포2 (표본분산, 표본표준편차, 표준화, 변동계수)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 자료들 간의 거리를 이용하여 산포도를 계산하는 방법(표본분산, 표본표준편차)을 알아보겠습니다. 자료분석에서 측정 단위에 영향을 받지 않게 만드는 표준화에 대해 알아보겠습니다. 그리고 평균으로 표본표준편차를 보정한 변동계수를 알아보겠습니다. (3) 표본분산과 표본표준편차 범위나 사분위수범위의 경우 특정 위치의 두 값을 이용하기 때문에 표본의 정보를 많이 활용하지 못합니다. 이런 문제를 해결하기 위해 모든 자료들 간의 거리의 합을 이용하는 것 입니다. 수학적으로 거리 $D$는 임의의 점 a, b, c에 대해 다음과 같은 성질을 만족합니다. 우리는 거리$D$의 성질 중 $D$(..

[통계학] 02-4. 기술통계 (4) - 수치자료 분포의 중심위치(평균, 표본비율, 기하평균, 조화평균, 가중평균)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 7. 수치를 이용한 자료 정리 그래프 같은 시각적 기법은 자료의 특성을 파악하는데 있어 중요한 정보를 제공하지만 그것을 보는 사람에 따라 주관적으로 해석될 수 있습니다. 그렇기 때문에 일반적으로 자료분석의 최종 결과는 자료의 특성을 객관적으로 나타내는 수치로 제시됩니다. 일반적으로 자료의 특성은 자료를 대표할 수 있는 중심위치(central location)와 자료들이 얼마나 퍼져 있는지를 나타내는 산포(dispersion)로 표시된됩니다. 이번 포스팅에서는 수치자료 분포의 중심위치(평균, 표본비율, 가중평균, 기하평균, 조화평균)에 대해서 알아보겠습니다. 7.1 중심위치..

[통계학] 02-2. 기술통계 (2) - 범주형 자료 정리(도수분포표, 원도표, 막대그래프)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 2. 표를 이용한 자료정리(범주형) 2.1 도수분포표 - frequency table 도수분포표는 범주형 자료 정리시 가장 많이 이용됩니다. 도수분포표는 각 범주에 몇 개의 관측개체가 있는지를 정리한 표입니다. 도수(frequency) 범주에 속한 관측개체의 수 (=빈도) 상대도수(relative frequency) 전체 자료 중 해당 범주에 속한 자료의 비율 $상대도수 = \frac{해당 범주 관측개체의 수}{전체 관측개체의 수}$ 로 구할 수 있습니다. 상대도수에 100을 곱해 % 표시를 하기도 합니다. 다음 자료를 살펴보겠습니다. 자료 1은 통계학의 이해 성적분포를 ..

[통계학] 02-1. 기술통계 (1) - 자료의 종류와 구조(범주형, 수치형자료)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 2장 기술통계 - Descriptive statistics 이번 장에서는 자료를 속성에 따라 분류하고 이 분류에 따라 자료를 표나 그래프와 같은 시각적인 방법으로 정리하는 방법에 대해 알아보겠습니다. 또한 평균이나 분산과 같은 수치를 이용하여 자료의 특성을 알아보는 방법에 대해 알아보겠습니다. 1. 자료의 종류와 구조 자료를 속성에 따라 어떻게 분류하는지 알아보겠습니다. 아래의 신체검사 자료(데이타셋)을 확인하겠습니다. 위의 자료에서 변수와 관측개체를 확인할 수 있습니다. 변수와 관측개체가 무엇인지 알아보겠습니다. 변수(variable) 위의 자료에서 성별, 혈액형, 비만..

[통계학] 01-1. 통계학이란? (1) - 모집단과 표본

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 1장 통계학이란? 1장에서는 통계학이 어떤 학문인지를 알아보기 위해 필요한 개념들과 통계분석에 사용되는 자료를 어떻게 수집하는지 등에 대해 간략하게 알아보겠습니다. 1. 모집단(population)과 표본(sample) 모집단(population) 연구대상이 되는 모든 개체의 집합 표본(sample) 모집단에서 선택된 일부의 자료 [중요한점 2가지] 추출된 표본이 모집단을 대표할 수 있는가? 몇 개의 표본을 어떻게 뽑아야 하는가? 추론 이론으로 계산해야 한다. 기타 용어 전수조사(cencus) 연구대상 전체를 조사하는 경우, 대부분의 모집단은 매우 커 전체를 조사하기 어려..

반응형