수학/기초 통계학

[통계학] 10-2. 기하분포

AI 꿈나무 2020. 9. 20. 15:33
반응형

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다.

(k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다.

 


 

 베르누이시행의 응용분포인 기하분포에 대해 알아보겠습니다.

 기하분포의 중요한 특성인 무기억성을 알아보겠습니다.

 


1. 기하분포 - geometric distribution

 기하분포는 베르누이 시행을 성공할 때까지의 실패(시행) 횟수의 분포입니다.

 이항분포나 초기하분포에서는 시행횟수 n을 정해놓고 그 중에 성공한 횟수에 관심을 가졌으나 어떤 경우에는 시행횟수에 관심을 가질 때가 있습니다.

 이 경우에 기하분포를 이용합니다.

 중요한 특성은 무기억성입니다.

 

 확률질량함수는 다음과 같이 나타낼 수 있습니다.

 기하분포에서 $X$는 성공할때 까지 시행했을 때 실패한 횟수를 의미합니다.

 $Y$는 성공할 때 까지 시행한 횟수를 의미합니다.

 이 둘의 관계는 다음과 같습니다.

 

 이런 확률질량함수를 가지는 경우 모수가 $p$인 기하분포를 따른다고 하고 다음과 같이 표시합니다.

 

 x번째 실험 이전에 성공할 확률은 다음과 같이 나타낼 수 있습니다.

 $P(X \leq x-1)$은 x-1번째 이전까지 실패할 확률을 의미합니다.

 

 x번째 실험 이전에 실패할 확률을 구하면 다음과 같습니다.

 

 x+1번째 시행 이후에 성공(x번째까지 실패)할 확률은 다음과 같습니다.

 

 x번째까지 실패했다고 할 때, 다음(x+1번째) 시행에서의 성공 확률은 다음과 같이 구할 수 있습니다.

 

 이를 무기억성(memoryless)이라고 합니다.

 5번 연속 뒷면이 나왔다고 하더라도 6번째가 앞면일 확률은 0.5로 동일합니다.

 

 x번째 실험 이전에 성공할 확률은 다음과 같이 구할 수 있습니다.

 

2. 기하분포의 기대값

 기하분포의 기대값은 다음과 같습니다.

 여기서 $X$는 실패한 횟수

 $Y$는 시행횟수를 의미합니다.

 

3. 예시문제

 동전을 앞면(p=1/2)이 나올 때 까지 동전을 던지기로 하겠습니다.

 2번 이내 끝날 확률은 다음과 같이 구할 수 있습니다.

 

 $P(Y \leq y) \geq 0.9$를 만족하는 최소 $y$는 다음과 같이 구할 수 있습니다.

 

 기댓값은 1/p로 2가 나온다는 것을 확인할 수 있습니다.

 


 

 이상으로 기하분포에 대해서 알아보았습니다. 기하분포는 성공횟수가 아닌 성공을 위한 실행횟수에 관심을 가질 때 이용됩니다. 감사합니다.

 

반응형

'수학 > 기초 통계학' 카테고리의 다른 글

[통계학] 10-4. 다항분포  (1) 2020.09.20
[통계학] 10-3. 음이항분포  (0) 2020.09.20
[통계학] 10-1 포아송분포  (0) 2020.09.20
[통계학] 09-3. 초기하분포  (0) 2020.09.20
[통계학] 09-2. 이항분포  (1) 2020.09.19