반응형

확률 20

[확률론] 연속형 확률분포 - 지수 분포(Exponential distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 지수 분포(Exponential Distribution) 정규분포 다음으로 많이 쓰이는 지수분포입니다. 지수분포는 항상 시간을 떠올려야 합니다. 지수 분포는 이벤트 사이의 시간(이벤트 A와 이벤트 B 사이에 걸린 시간)을 모델링하는데 많이 이용합니다. 각 이벤트는 포아송분포에 의해서 생성됩니다. 지수 분포의 모수(parameter)는 람다($\lambda$) 입니다. 람다는 단위 시간동안 평균 이벤트 발생횟수를 의미합니다. 포아송 분포의 모수와 동일합니다. 포아송 분포와 지수 분포는 밀접한 관계가 존재합니다. 이 둘..

수학/확률론 2021.03.06

[확률론] 연속형 확률분포 - 정규 분포(Normal Distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 정규 분포(Normal Distribution) 정규분포는 가우시안 분포(Gaussian Distribution)으로 부르기도 합니다. 확률 변수 X가 정규 확률 변수거나 정규 분포를 따를 때, 확률 밀도 함수(pdf)는 다음과 같습니다. 모수(parameter)는 $\mu$(평균), $\sigma^2$(분산) 입니다. 모수는 확률 분포의 모양을 결정하는 중요한 수입니다. $\mu$ = 0, $\sigma$ =1 일때, 정규 분포는 다음과 같습니다. 위 분포에서 모수가 바뀌게 되면 분포의 위치와 모양이 변경됩니다. ..

수학/확률론 2021.03.05

[확률론] 연속형 확률 분포 - 일양 분포(uniform distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 일양 분포(Uniform Distribution) 일양 분포는 확률 변수 X가 구간 $\alpha, \beta$에서 균일한 확률을 지니고 있습니다. 확률 밀도 함수는 다음과 같이 정의합니다. 연속형 확률 분포의 총합(면적)은 1이 되어야 합니다. 구건 $\alpha, \beta$ 사이에 일정한 확률을 갖고, 면적이 1이 되야 하므로 확률은 1/($\beta - \alpha$가 됩니다. 일양 분포의 cdf는 세 가지 구간으로 나눠서 살펴볼 수 있습니다. 일양 분포의 기대값과 분산 기대값과 분산은 다음과 같이 정의합니다..

수학/확률론 2021.03.04

[확률론] 이산형 확률분포 - 초기하 분포

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 초기하 분포(Hypergeometric Distribution) m개 흰색 공, N - m개 검은색 공으로 구성된 N개의 공을 포함하고 있는 항아리에서 비복원 추출로 n개 공을 꺼낸다고 가정하겠습니다. 확률 변수 X는 흰색 공이 뽑힌 수로 정의합니다. 초기하 분포의 확률질량함수는 다음과 같습니다. 파라미터는 n: 샘플링 수, N: 공의 수, m: 흰색 공의 수 3가지를 갖습니다. 그리고 초기하 분포는 품질에서 불량이 몇개 인지 파악하기 위해 많이 쓰입니다. 초기하 분포의 파라미터 초기하 분포는 N, n, m 3가지 ..

수학/확률론 2021.02.14

[확률론] 이산형 확률분포 - 포아송 분포

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 포아송 분포(Poisson distribution) 확률 변수 X가 이산형 값인 0,1,2,... 중 하나를 취할 때 파라미터 $\lambda$를 지닌 포아송 확률 변수라고 정의합니다. $\lambda$(람다) = np는 단위 시간 동안 특정 사건이 몇번 발생한 것인지를 나타냅니다. 단위 시간동안 사건의 평균 발생 회수로 이해하면 됩니다. 그리고 포아송 확률 변수에서 나온 실수를 확률로 변환해주는 확률질량함수는 다음과 같이 정의됩니다. 포아송 확률질량함수는 실수를 확률로 대응하는 함수이므로 모든 값을 더하면 1이 됩..

수학/확률론 2021.02.10

[확률론] 독립 사건

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 독립 사건(Independent Events) 이번 포스팅에서는 독립 사건에 대해 알아보도록 하겠습니다. 사건 A와 B가 독립이면 P(B l A) = P(B) 가 됩니다. 이것은 어떤 의미를 갖고 있을 까요?? 사건 A가 발생하던 말던 사건 B의 확률이 동일하다는 것을 의미합니다. 그리고 이를 사건 A와 B가 독립(independent)이라고 합니다. P(B l A) = P(B)에서 조건부확률을 교집합으로 표현해보도록 하겠습니다. P(B l A) = P(BA) / P(A) = P(B) 가 됩니다. 이를 정리하면 P(..

수학/확률론 2021.01.31

[확률론] Odds(오즈, 아즈)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. Odds(아즈, 오즈) Odds는 사건 A가 발생하지 않을 경우 대비 발생할 확률을 의미합니다. Odds는 보통 도박에서 배당률을 결정할 때 이용하고 있습니다. 그리고 다음과 같이 정의 됩니다. 만약 사건 A의 성공 확률이 1일 경우 Odds는 무한대의 값을 갖게 됩니다. 성공 확률이 0일 경우 Odds는 0의 값을 갖습니다. Odds를 이용하여 문제를 풀어보도록 하겠습니다. 예시 문제 1 항아리에 A 동전 두개와 B 동전 하나가 들어있습니다. 동전 A를 던졌을 때, 앞면이 나올 확률은 1/4, 동전 B를 던졌을 때..

수학/확률론 2021.01.29

[통계학] 09-2. 이항분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 대표적인 이산분포인 이항분포의 성질에 대해 알아보겠습니다. 1. 이항분포 - Binimial distribution 성공확률인 $p$인 베르누이시행을 $n$번 반복했을 때 성공 횟수($X$)의 분포를 이항분포라고 합니다. $X_i ~ B(p)$라고 할 때, 확률변수 $X$는 $n$개의 베르누이시행에서 성공한 횟수를 의미합니다. 확률변수 $X$는 $n$개의 베르누이 확률변수의 합으로 $X$의 기댓값은 베르누이확률변수의 기댓값의 합으로 표시됩니다. 베르누이확률변수는 서로 독립이기 때문에 $X$의 분산도 다음과 같이 각각의 베르누이 분산의 합으로 표시합니다. 표준..

[통계학] 08-1. 확률벡터(1) - 분산과 표준편차

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 모집단의 분포가 얼마나 퍼져있는지를 나타내는 분산 및 표준편차의 계산과 성질에 대해 알아보겠습니다. 1. 분산 표본평균은 자료의 중심위치를 의미하며, 분산과 표준편차는 자료가 얼마나 펴져 있는가에 대한 통계값입니다. 분산을 식으로 표기하면 다음과 같습니다. 이를 간편식으로 나타내면 다음 식이 됩니다. 위의 식이 어떻게 도출되었는지 알아보도록 하겠습니다. 표본크기가 n개가 있고 자료가 k개가 있어 이들 값을 $x_1, ... , x_2$라고 하겠습니다. $n_i$는 표본 중 $x_i$값을 가지는 표본수라고 하겠습니다. 값이 중복되는 자료가 있기 때문에 n > ..

[통계학] 07-5. 확률변수의 기댓값 - 기댓값의 성질

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 다양한 확률 및 통계문제를 해결하기 위해 기댓값의 성질에 대해 알아보도록 하겠습니다. 1. 기댓값 - expected value 기댓값은 확률변수에 대해 평균적으로 기대하는 값이라는 의미를 갖은 용어로 평균과 같은 개념입니다. 그래서 $X$의 평균을 $X$의 기댓값이라고 하고 $E(X)$로 표시합니다. 즉 $E(X) = \mu $가 됩니다. 기댓값을 설명하기 위해 모평균을 설명하도록 하겠습니다. 모평균은 표본평균에서 표본크기 n을 계속 크게하여 통계적 확률의 관점에서 볼 때 표본들은 모집단으로, 표본평균은 모평균으로 수렴한 것을 의미합니다. 모평균을 설명하기..

반응형