반응형

통계 6

[통계학] 최대 우도 추정법(Maximum Likelihood)

최대 우도 추정에 대해서 공부하다가 이해가 잘 되도록 쉽게 설명해주는 유튜브가 있어서 내용을 정리해봤습니다!! 출처 : www.youtube.com/watch?v=XepXtl9YKwc 예를 들어, 쥐들의 무게를 잰다고 가정해보겠습니다. 최대 우도의 목적은 데이터 분포를 맞추기 위한 최적의 방법을 찾는 것입니다. 다양한 데이터 타입에 대한 다양한 분포가 존재합니다. 정규분포, 지수분포, 감마분포 등등 여러 분포가 존재합니다. 데이터 분포를 맞추려고 하는 이유는 작업하기가 쉽고 더 일반적이기 때문입니다. 이 경우에 몸무게가 정규 분포를 따른다고 생각할 수 있습니다. 정규분포는 많은 것들을 의미합니다. 첫 번째로 대부분의 쥐 몸무게는 평균에 가깝습니다. 두 번째로 쥐 몸무게가 평균을 중심으로 대칭입니다. 관측..

[확률론] 연속형 확률분포 - 지수 분포(Exponential distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 지수 분포(Exponential Distribution) 정규분포 다음으로 많이 쓰이는 지수분포입니다. 지수분포는 항상 시간을 떠올려야 합니다. 지수 분포는 이벤트 사이의 시간(이벤트 A와 이벤트 B 사이에 걸린 시간)을 모델링하는데 많이 이용합니다. 각 이벤트는 포아송분포에 의해서 생성됩니다. 지수 분포의 모수(parameter)는 람다($\lambda$) 입니다. 람다는 단위 시간동안 평균 이벤트 발생횟수를 의미합니다. 포아송 분포의 모수와 동일합니다. 포아송 분포와 지수 분포는 밀접한 관계가 존재합니다. 이 둘..

수학/확률론 2021.03.06

[확률론] 연속형 확률분포 - 정규 분포(Normal Distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 정규 분포(Normal Distribution) 정규분포는 가우시안 분포(Gaussian Distribution)으로 부르기도 합니다. 확률 변수 X가 정규 확률 변수거나 정규 분포를 따를 때, 확률 밀도 함수(pdf)는 다음과 같습니다. 모수(parameter)는 $\mu$(평균), $\sigma^2$(분산) 입니다. 모수는 확률 분포의 모양을 결정하는 중요한 수입니다. $\mu$ = 0, $\sigma$ =1 일때, 정규 분포는 다음과 같습니다. 위 분포에서 모수가 바뀌게 되면 분포의 위치와 모양이 변경됩니다. ..

수학/확률론 2021.03.05

[확률론] 연속형 확률 분포 - 일양 분포(uniform distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 일양 분포(Uniform Distribution) 일양 분포는 확률 변수 X가 구간 $\alpha, \beta$에서 균일한 확률을 지니고 있습니다. 확률 밀도 함수는 다음과 같이 정의합니다. 연속형 확률 분포의 총합(면적)은 1이 되어야 합니다. 구건 $\alpha, \beta$ 사이에 일정한 확률을 갖고, 면적이 1이 되야 하므로 확률은 1/($\beta - \alpha$가 됩니다. 일양 분포의 cdf는 세 가지 구간으로 나눠서 살펴볼 수 있습니다. 일양 분포의 기대값과 분산 기대값과 분산은 다음과 같이 정의합니다..

수학/확률론 2021.03.04

[확률론] 이산형 확률분포 - 초기하 분포

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 초기하 분포(Hypergeometric Distribution) m개 흰색 공, N - m개 검은색 공으로 구성된 N개의 공을 포함하고 있는 항아리에서 비복원 추출로 n개 공을 꺼낸다고 가정하겠습니다. 확률 변수 X는 흰색 공이 뽑힌 수로 정의합니다. 초기하 분포의 확률질량함수는 다음과 같습니다. 파라미터는 n: 샘플링 수, N: 공의 수, m: 흰색 공의 수 3가지를 갖습니다. 그리고 초기하 분포는 품질에서 불량이 몇개 인지 파악하기 위해 많이 쓰입니다. 초기하 분포의 파라미터 초기하 분포는 N, n, m 3가지 ..

수학/확률론 2021.02.14

[확률론] 이산형 확률분포 - 포아송 분포

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 포아송 분포(Poisson distribution) 확률 변수 X가 이산형 값인 0,1,2,... 중 하나를 취할 때 파라미터 $\lambda$를 지닌 포아송 확률 변수라고 정의합니다. $\lambda$(람다) = np는 단위 시간 동안 특정 사건이 몇번 발생한 것인지를 나타냅니다. 단위 시간동안 사건의 평균 발생 회수로 이해하면 됩니다. 그리고 포아송 확률 변수에서 나온 실수를 확률로 변환해주는 확률질량함수는 다음과 같이 정의됩니다. 포아송 확률질량함수는 실수를 확률로 대응하는 함수이므로 모든 값을 더하면 1이 됩..

수학/확률론 2021.02.10
반응형