수학/기초 통계학

[통계학] 11. 정규분포, 표준화, 표준정규분포

AI 꿈나무 2020. 9. 21. 15:14
반응형

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다.

(k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다.

 


 

 통계학에서 가장 중요한 분포인 정규분포에 대해 알아보겠습니다.

 표준화를 알아보고 정규분포에 표준화를 거친 표준정규분포를 알아보겠습니다.

 정규분포의 성질에 대해서 알아보겠습니다.

 


1. 정규분포

[정규분포란?]

 이항분포가 대표적인 이산확률분포라고 하면

 정규분포는 대표적인 연속확률분포 입니다.

 

 정규분포의 확률밀도함수는 다음과 같이 나타낼 수 있습니다.

 여기서 $\mu$는 평균, $\sigma^2$는 분산, $\sigma$는 표준편차를 의미합니다.

 $X$가 평균이 $\mu$이고 분산이 $\sigma^2$인 정규확률변수라고 하면 $X$ ~ $N(\mu,\sigma^2)$로 표시합니다.

 모수는 평균과 분산입니다.

 

 그림으로 나타내면 다음과 같습니다.

정규분포의 비교

 

 

[평균과 분산의 의미]

 $\mu$는 분포의 중심, 평균, 중앙값, 최빈값을 의미합니다.

 $\sigma^2$는 퍼져있는 정도를 의미합니다.

 

 

[$P(a < X < b)$ 확률계산]

정규분포에서의 확률

 $X$가 평균이 $\mu$이고 분산이 $\sigma^2$인 정규분포를 따를 때, $X$가 임의의 구간 [a,b]에 있을 확률은 확률밀도함수의 면적입니다.

 이 확률은 다음과 같은 적분을 통해 구할 수 있습니다.

 이 적분식은 직접 계산할 수 없습니다. 통계관련 프로그램이나 표준화를 통해 표준정규분포로 만든 뒤 표준정규표를 이용하여 계산할 수 있습니다.

 

2. 정규분포의 표준화

[표준화란?]

 표준화는 각 자료에서 평균을 빼고 표준편차를 나누어 위치와 척도에 영향을 받지 않도록 합니다.

 정규분포의 확률을 구하기 위해 표준화를 적용하여 표준정규표 이용합니다.

 표준화를 하면 $\mu$ = 0, $\sigma^2$ = 1인 표준정규분포가 만들어집니다.

  

3. 표준정규분포

 표준화를 적용한 정규분포를 표준정규분포라고 합니다.

 $\mu$ = 0이고 $\sigma^2$ = 1인 정규분포이며 일반적으로 $Z$ ~ $N(0,1)$로 표시합니다.

 또한 0을 기준으로 대칭입니다.

 

 확률밀도함수는 다음과 같습니다.

 

 

[$P(a < X < b)$ 확률계산]

 표준정규분포는 표준정규분포표를 통해 확률을 계산할 수 있습니다.

표준정규분포표

 표준정규분포는 0을 중심으로 대칭이라는 사실을 이용해야 합니다.

 이처럼 표를 보고 확률을 계산할 수 있습니다.

 

 

[분위수]

 $\alpha$가 주어지고 $P(Z > z) = \alpha$를 만족하는 $z$(분위수)에 대해 알아보겠습니다.

 주요 분위수는 0.025, 0.05, 0.95, 0.975에 해당하는 값은 다음과 같습니다.

$$z_{0.05} = 1.645, z_{0.025} = 1.96, z_{0.95} = -z_{0.05} = -1.645, z_{0.975} = -z_{0.025} = -1.96$$

입니다.

 

4. 정규분포의 성질

 (1) 선형변환된 정규확률변수도 정규분포를 따릅니다.

 

 

(2) 두 정규확률변수의 선형결합도 정규분포를 따릅니다.

 $X_1$ ~ $N(\mu_1, \sigma_1^2)$이고 $X_2$ ~ $N(\mu_2, \sigma_2^2)$이면 $X_1 + X_2$는?

 

 두 확률변수 $X_1$과 $X_2$가 독립이면, $\sigma_{12}$(공분산) = 0입니다.

 

 기존에는 두 확률변수가 독립일 때 공분산은 0이고, 공분산이 0일 때 두 확률변수는 독립이 아닐수도 있었지만

 정규분포에서는 공분산이 0 이면 두 확률변수는 독립입니다.

 

5. 예시문제

 아침식사를 빵과 우유만 먹는다고 가정하겠습니다.

 

아침식사에서 300칼로리 이상 섭취할 확률은? 0.1587

 (빵의 열량 + 우유의 열량)의 평균과 분산을 구한 뒤에 표준화를 합니다. ( 독립이라고 가정)

 표준정규분포표를 보고 구할 수 있습니다.

 

동일한 식사를 일주일 했을 때, 300칼로리 이상 섭취할 날이 하루일 확률은?

 이 문제는 이항분포를 이용해야 합니다.

 성공확률 p = 0.1597와 시행횟수 7번 중 1번 성공할 확률을 구하면 됩니다.

 


 

 이상으로 정규분포, 표준화, 표준정규분포, 정규분포의 성질도 알아보았습니다. 감사합니다.

 

반응형

'수학 > 기초 통계학' 카테고리의 다른 글

[통계학] 13. 표집분포  (0) 2020.09.21
[통계학] 12. 확률표본과 통계량  (0) 2020.09.21
[통계학] 10-4. 다항분포  (1) 2020.09.20
[통계학] 10-3. 음이항분포  (0) 2020.09.20
[통계학] 10-2. 기하분포  (0) 2020.09.20