수학/기초 통계학

[통계학] 07-1. 확률변수의 정의와 종류 (이산확률변수, 연속확률변수)

AI 꿈나무 2020. 9. 16. 23:52
반응형

 

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다.

(k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다.

 


 

 통계학에서 가장 중요한 확률변수에 대해 알아보겠습니다.

 확률변수가 무엇인지 알아보고 확률변수의 두 가지 종류에 대해서 알아보겠습니다.

 


 

 우리가 경험하는 대부분의 사회, 자연적 현상은 불확실성을 가지고 있기 때문에 완벽하게 설명되지 않고 어떤 결과가 나올지 예측하기 어렵습니다. 완벽하게 설명할 수 없거나 예측할 수 없다는 것은 확률실험이 가지는 성질 중 하나입니다.

 통계학에서는 이런 불확실한 현상을 일종의 확률실험으로 봅니다. 확률실험의 불확실성을 효과적으로 분석하기 위해 통계학에서는 표본공간의 원소를 숫자로 바꾸어 확률실험을 수리적으로 모형화할 수 있도록 합니다. 이때 표본공간의 원소들을 숫자로 바꾸어 주는 역할을 하는 것이 확률변수입니다.

 

 

1. 확률변수 - random variable

 확률변수란 표본공간의 원소를 숫자로 대응시키는 함수를 의미합니다.

 확률변수는 그림에서 보는 것과 같이 $X, Y, Z$ 등으로 표시하며 확률변수가 취하는 값을 소문자 $x, y, z$로 표시합니다. 동일한 확률실험과 표본공간을 갖고 있어도 관심이 어디에 있는가에 따라 $X$는 다른 값을 갖게 됩니다.

 

 불확실성을 가지는 사회적, 자연적 현상을 일종의 확률실험으로 이해합니다. 확률실험의 가장 큰 특징은 불확실성입니다. 확률변수는 불확실성을 가진 어떤 현상이나 실험의 결과를 숫자로 바꾸는 역할을 합니다. 이렇게 숫자로 바꾸면 사칙연산이나 각종 수학이론을 적용할 수 있게 되어 확률실험을 수리적으로 모형화할 수 있게 됩니다. 확률실험을 수리적으로 모형화하면 불확실성을 좀 더 계량적으로 분석할 수 있습니다. 통계학은 확률실험의 불확실성을 제거하는 것이 아니라 수리적으로 모형화하는 것 입니다.

 

 

 예를 들어 설명하겠습니다.

 

예시1

 동전의 앞면을 $H$, 뒷면을 $T$라고 할 때 동전을 세 번 던지는 확률실험의 표본공간은 다음과 같습니다.

 만약 이 확률실험에서 앞면의 수나 앞면과 뒷면의 수의 차이에 관심이 있다고 합시다. 앞면의 수를 $X$라고 표시하고 앞면과 뒷면의 수의 차이를 $Y$라고 하면 표본공간의 각 원소에 대응하는 $X$와 $Y$의 값은 다음과 같습니다.

 여기서 $X$와 $Y$는 표본공간의 원소들을 숫자로 바꾸어 주는 역할을 합니다. 이와 같이 표본공간의 원소를 숫자로 바꾸어주는 함수, 즉 표본공간의 원소를 숫자로 대응시키는 함수를 확률변수라고 합니다.

 

2. 이산확률변수(discrete random variable)와 연속확률변수(continuous random variable)

 확률변수는 변수가 취하는 값의 종류에 따라 이산확률변수와 연속확률변수로 나눌 수 있습니다.

 

(1) 이산확률변수

 확률변수 $X$가 가질 수 있는 값들이 가산(countable)이거나 셀 수 있으면 $X$를 이산확률변수(discrete random variable)라고 합니다. '가산'또는 '셀 수 있다'는 말은 $X$의 값들이 자연수 1, 2, 3, ... 과 대응관계를 가진다는 의미입니다. 확률변수가 무한히 많은 값을 갖는다고 하더라도 각각의 값에 순서를 부여할 수 있다면 이는 이산확률변수가 됩니다.

 

예시1

 윷 하나를 젖혀질 때까지 던지는 확률실험을 생각해보겠습니다. 윷이 젖혀지면 $S$, 엎어지면 $F$라고 하겠습니다. 또한 $X$는 윳을 던진 횟수, $Y$는 엎어진 수라고 하겠습니다.

 확률변수를 통해 확률실험으로 도출한 표본공간의 각 원소들을 숫자로 바꾸어 주었고 Y = X -1 이라는 수학적인 식을 도출할 수 있었습니다.

 

 또한 불량품의 개수, 사고건수 등등이 있습니다.

 

 

 

(2) 연속확률변수

 $X$가 가질 수 있는 값이 셀 수 없을 정도로 많으면 연속확률변수라고 합니다.

 예시로 수명, 신장, 체중, 휴대전화의 수명이 있습니다.

 휴대전화의 수명에서 표본공간은 {x $\leq$ 0}으로 표시할 수 있습니다. 무수히 많기 때문에 연속확률변수라고 합니다.

 


 

 이상으로 확률변수의 정의와 종류에 대해서 알아보았습니다. 다음에는 확률변수의 값에 대해 확률을 표시한 확률분포에 대해서 알아보겠습니다. 감사합니다.

 

 

반응형