반응형

통계학 52

[통계학] 22. 유의확률(p-값)

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 유의확률(p값)이 무엇이고 어떻게 사용하는지를 알아 보겠습니다. 1. 모평균의 검정방법 가정 : $X_1, X_2, ... , X_n$ ~ iid $N(\mu, \sigma^2), \sigma^2$는 알고 있음 가설설정 가설을 설정한 뒤에 추출한 표본의 표본평균의 중심축량을 구합니다. 중심축량에 귀무가설을 대입하여 검정통계량을 도출합니다. 유의수준을 설정하고 그에 따른 기각역을 도출할 수 있습니다. 검정통계량 값이 기각역에 포함되면 귀무가설을 기각합니다. 2. 예시문제 새로운 파이의 칼로리가 기존 칼로리 165kcal보다 낮다는 것을 보이기 위해 25개의 파이를 조사한다고 하겠습니다. 가정 : 칼로리 분포는 $N(\mu..

[통계학] 21. 유의수준과 검정력

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 유의수준의 개념과 얼마로 정해야 하는지를 알아 보겠습니다. 검정력의 개념과 유의수준과의 관계를 알아보겠습니다. 1. 유의수준과 검정력 유의수준은 가장 큰 제1종의 오류의 확률을 의미합니다. 제1종의 오류는 귀무가설이 참일때 귀무가설을 거짓으로 판변한 것입니다. 검정력은 (1 - 제2종의 오류 확률)을 의미합니다. 제2종의 오류는 대립가설이 참일때 대립가설을 거짓으로 판변할 것입니다. 2. 제1종의 오류확률과 유의수준 예시문제를 통해 제1종의 오류확률을 구하는 법을 보도록 하겠습니다. 가장 큰 제1종의 오류의 확률이 유의수준입니다. 검정원칙이 $\overline{X} \geq 0.5$일 때 $\mu$ = 0일 때가 제1종..

[통계학] 19. 통계적 가설과 가설검정의 원리

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 가설의 종류와 개념을 알아보겠습니다. 가설검정의 기본원리를 이해하겠습니다. 1. 가설검정 - testing hypothesis 가설검정은 모집단의 모수 또는 분포에 대한 추측이나 주장을 설정하고 이것의 옳고 그름을 표본의 정보를 이용하여 확률적으로 판정하는 과정입니다. 2. 가설 - hypothesis 가설은 모수 또는 분포(모집단)에 대한 추측이나 주장을 의미합니다. (1) 귀무가설(Null hypothesis, $H_0$) 검정의 대상이 되는 가설입니다. (2) 대립가설(Alternative hypothesis, $H_1$) 표본으로부터 얻은 정보를 이용해 입증하고자 하는 가설입니다. 3. 귀무가설과 대립가설의 기본..

[통계학] 18. 구간추정과 신뢰구간

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 구간추정의 주요개념과 과정을 알아보겠습니다. 1. 구간 추정 구간추정은 미지의 모수가 포함될 것으로 기대하는 범위를 확률적으로 택하는 과정입니다. 관심모수가 $\phi$라고 하면 구간추정에서는 아래 식과 같이 $\phi$를 포함할 확률이 1-$\alpha$인 구간 [L, U]를 구합니다. $$P(L < \phi < U) = 1 - \alpha$$ 여기서 [L, U]를 신뢰구간(confidence interval)이라고 합니다. L과 U는 확률변수로 이를 유도하는데 점추정량이 중심적 역할을 합니다. 또한 100(1-$\alpha$)%를 신뢰수준(confidence level)이라고 합니다. 2. 모평균 $\mu$에 대한 ..

[통계학] 14. 중심극한정리

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 확률표본을 이용하여 계산된 표본평균(합)의 통계적 성질을 알아보겠습니다. 통계학의 중요 이론인 중심극한정리에 대해 알아보겠습니다. 1. 큰 수의 법칙 - Law of large numbers, 대수의 법칙 표본평균의 분산에서 n을 계속 크게 만들면 분산이 0이 됩니다. 이를 큰 수의 법칙이라고 합니다. 분산이 0이라는 의미는 표본평균은 모평균에 수렴한다는 의미입니다. 2. 중심극한정리 - Central limit thorem, CLT 중심극한정리는 모집단의 형태와 관계없이 표본크기 $n$이 커질수록 $\overline X$의 분포는 정규분포에 근사한다는 성질..

[통계학] 11. 정규분포, 표준화, 표준정규분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 통계학에서 가장 중요한 분포인 정규분포에 대해 알아보겠습니다. 표준화를 알아보고 정규분포에 표준화를 거친 표준정규분포를 알아보겠습니다. 정규분포의 성질에 대해서 알아보겠습니다. 1. 정규분포 [정규분포란?] 이항분포가 대표적인 이산확률분포라고 하면 정규분포는 대표적인 연속확률분포 입니다. 정규분포의 확률밀도함수는 다음과 같이 나타낼 수 있습니다. 여기서 $\mu$는 평균, $\sigma^2$는 분산, $\sigma$는 표준편차를 의미합니다. $X$가 평균이 $\mu$이고 분산이 $\sigma^2$인 정규확률변수라고 하면 $X$ ~ $N(\mu,\sigma^2..

[통계학] 10-3. 음이항분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 베르누이시행의 응용분포인 음이항분포에 대해 알아보겠습니다. 1. 음이항분포 - negative binomial distribution 음이항분포는 성공할 확률이 $p$인 베르누이 시행을 $r$번 성공할 때 까지 시행하는 경우 실패(시행)횟수의 분포입니다. 실패횟수관점, 시행횟수관점 두 가지 관점으로 이용할 수 있습니다. (1) 실패횟수 관점 $X$는 실패횟수라고 하겠습니다. $X=x$라고 하면, $x + r$번째는 S(성공)이 됩니다. $x+r-1$번째까지의 결과에서 성공은 $r-1$개, 실패는 $x$개가 존재합니다. 실패횟수 관점에서 확률질량함수는 다음과 ..

[통계학] 10-1 포아송분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 계수자료(counting data)에 대한 대표적인 분포인 포아송분포의 성질에 대해 알아보겠습니다. 포아송분포를 이용해 이항분포 확률의 근사값 계산방법을 알아보겠습니다. 1. 포아송분포 이항분포에서 $n$이크고 $p$가 작은 경우 계산하기가 어렵습니다. 이 경우에 포아송분포를 이용하여 이항분포의 근사확률을 구하면 됩니다. 포아송분포의 확률질량함수는 다음과 같습니다. 여기서 $\lambda$는 $np$를 의미합니다. 포아송분포의 조건은 다음과 같습니다. 발생 가능성이 희박한 사건이 임의의 구간에서 평균적으로 $\lambda$번 발생 구간을 나누었을 때 각 구간..

[통계학] 09-3. 초기하분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 유한모집단이 두 그룹으로 나누어져 있고 표본을 비복원으로 추출할 때 특정 그룹에서 뽑힌 표본의 수에 대한 확률분포를 알아보겠습니다. 초기하분포의 성질과 관련 문제에 대해 알아보겠습니다. 1. 초기하분포 - Hypergeometric Distribution 초기하분포란 크기가 $N$인 모집단이 크기가 $M$과 $N-M$인 두 개의 부모집단 (A, B)로 나누어진 경우(유한 모집단) n개의 표본을 비복원 추출할 때, 부모집단(A)에서 추출된 표본 수의 분포를 의미합니다. (각 표본의 추출과정은 독립적이지 않음) 일반식은 다음과 같습니다. 여기서 분모의 값은 전체..

[통계학] 09-2. 이항분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 대표적인 이산분포인 이항분포의 성질에 대해 알아보겠습니다. 1. 이항분포 - Binimial distribution 성공확률인 $p$인 베르누이시행을 $n$번 반복했을 때 성공 횟수($X$)의 분포를 이항분포라고 합니다. $X_i ~ B(p)$라고 할 때, 확률변수 $X$는 $n$개의 베르누이시행에서 성공한 횟수를 의미합니다. 확률변수 $X$는 $n$개의 베르누이 확률변수의 합으로 $X$의 기댓값은 베르누이확률변수의 기댓값의 합으로 표시됩니다. 베르누이확률변수는 서로 독립이기 때문에 $X$의 분산도 다음과 같이 각각의 베르누이 분산의 합으로 표시합니다. 표준..

반응형