반응형

통계학 52

[통계학] 09-1. 베르누이 시행, 베르누이 확률변수, 베르누이 분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 1. 베르누이 시행 - Bernoulli trial 베르누이 시행의 세가지 조건이 있습니다. 예를 들어, 10개의 제품 중 7개가 정상, 3개가 불량품일때, 불량품이 뽑힌 것을 (S)라고 하겠습니다. 복원추출과 비복원추출 방법으로 각각 제품을 뽑았을 때 2개 모두 불량품일 확률은 다음과 같습니다. 2개를 복원추출하는 경우는 불량품이 뽑힐 확률이 항상 3/10이기 때문에 베르누이시행이라고 할 수 있습니다. 하지만 비복원추출의 경우 두 번째 추출은 첫 번째 추출결과에 영향을 받기 때문에 베르누이시행이라고 할 수 없습니다. 만약 상자에 10000개의 제품이 있고 ..

[통계학] 08-3. 확률벡터(3) - 기댓값, 공분산, 상관계수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 두 개 이상의 확률변수에 대한 기댓값 계산 방법을 알아보겠습니다. 두 변수의 직선관계 정도를 나타내는 공분산과 상관계수를 계산하고 독립일 때 이들 값이 0인 것을 보입니다. 두 변수의 선형결합과 관련된 평균과 분산의 성질에 대해 알아보겠습니다. 1. 기댓값 - expected value 두 확률변수 $X$와 $Y$에 대해 $X + Y$나 $XY$의 기댓값은 어떻게 계산해야 할까? 기댓값은 확률변수가 가질 수 있는 값에 해당 확률을 곱하여 다 더한 것으로 정의 했습니다. 두 확률변수의 기댓값은 이들 변수가 가질 수 있는 값에 해당 확률, 즉 결합확률질량함수를 ..

[통계학] 08-2. 확률벡터(2) - 결합분포, 주변분포, 독립확률변수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 두 확률변수의 확률구조를 설명하기 위한 결합분포와 주변분포에 대해 알아보겠습니다. 결합분포와 주변분포의 관계로부터 두 확률분포가 독립인지 아닌지를 확인하는 방법을 알아보겠습니다. 1. 확률벡터 - random vector 확률벡터: 확률변수를 순서열 $(X_1, X_2, ... ,X_p)$로 표시한 것을 확률벡터라고 합니다. 설명 자료를 수집할 때 특정 변수 하나만 관심을 가질 수 있으나 여러 가지 변수의 자료를 얻고 이들 변수들 간에 어떤 관계가 있는지 관심을 가질 수도 있습니다. 아이돌 가수 프로필 자료에서 신장, 체중 등의 여러 변수에 대한 자료를 수집..

[통계학] 08-1. 확률벡터(1) - 분산과 표준편차

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 모집단의 분포가 얼마나 퍼져있는지를 나타내는 분산 및 표준편차의 계산과 성질에 대해 알아보겠습니다. 1. 분산 표본평균은 자료의 중심위치를 의미하며, 분산과 표준편차는 자료가 얼마나 펴져 있는가에 대한 통계값입니다. 분산을 식으로 표기하면 다음과 같습니다. 이를 간편식으로 나타내면 다음 식이 됩니다. 위의 식이 어떻게 도출되었는지 알아보도록 하겠습니다. 표본크기가 n개가 있고 자료가 k개가 있어 이들 값을 $x_1, ... , x_2$라고 하겠습니다. $n_i$는 표본 중 $x_i$값을 가지는 표본수라고 하겠습니다. 값이 중복되는 자료가 있기 때문에 n > ..

[통계학] 07-5. 확률변수의 기댓값 - 기댓값의 성질

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 다양한 확률 및 통계문제를 해결하기 위해 기댓값의 성질에 대해 알아보도록 하겠습니다. 1. 기댓값 - expected value 기댓값은 확률변수에 대해 평균적으로 기대하는 값이라는 의미를 갖은 용어로 평균과 같은 개념입니다. 그래서 $X$의 평균을 $X$의 기댓값이라고 하고 $E(X)$로 표시합니다. 즉 $E(X) = \mu $가 됩니다. 기댓값을 설명하기 위해 모평균을 설명하도록 하겠습니다. 모평균은 표본평균에서 표본크기 n을 계속 크게하여 통계적 확률의 관점에서 볼 때 표본들은 모집단으로, 표본평균은 모평균으로 수렴한 것을 의미합니다. 모평균을 설명하기..

[통계학] 07-4. 연속확률변수와 확률밀도함수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 연속확률변수의 확률구조를 나타내는 확률밀도함수와 그 성질에 대해 알아보겠습니다. 1. 확률밀도함수 - pdf, probability density function 아래의 그림 처럼 연속확률변수 $X$의 분포형태, 즉 모집단의 형태를 나타낸 것으로 임의의 점 $x$에서의 밀도를 $f(x)$라고 표시하면 $f(x)$를 확률밀도함수라고 합니다. 히스토그램은 자료들을 적절한 구간으로 나누고 각 구간에 포함되어 있는 자료의 상대도수를 면적으로 표시한 것으로 전체 면적은 1이 됩니다. 이때 해당 구간의 높이를 밀도하고 했습니다. 이 밀도는 해당 구간에 상대적으로 얼마나..

[통계학] 07-1. 확률변수의 정의와 종류 (이산확률변수, 연속확률변수)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 통계학에서 가장 중요한 확률변수에 대해 알아보겠습니다. 확률변수가 무엇인지 알아보고 확률변수의 두 가지 종류에 대해서 알아보겠습니다. 우리가 경험하는 대부분의 사회, 자연적 현상은 불확실성을 가지고 있기 때문에 완벽하게 설명되지 않고 어떤 결과가 나올지 예측하기 어렵습니다. 완벽하게 설명할 수 없거나 예측할 수 없다는 것은 확률실험이 가지는 성질 중 하나입니다. 통계학에서는 이런 불확실한 현상을 일종의 확률실험으로 봅니다. 확률실험의 불확실성을 효과적으로 분석하기 위해 통계학에서는 표본공간의 원소를 숫자로 바꾸어 확률실험을 수리적으로 모형화할 수 있도록 합니..

[통계학] 06-3. 조건부확률 (3) - 베이즈 정리

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 조건부 확률의 주요 이론인 베이즈 정리에 대해 알아보고 베이즈 정리와 관련된 다양한 응용문제를 다루어보겠습니다. 1. 베이즈 정리 - Bayes' theorem 베이즈 정리는 조건부확률을 이용하여 계산하는 이론입니다. 식은 다음과 같습니다. 조건부 확률의 두 가지 응용식을 이용했습니다. 이제 베이즈 정리에 대해 알아보도록 하겠습니다. 베이즈 정리는 원인과 결과 형태의 문제에서 결과에 대한 원인 분석을 가능하게 합니다! 조건부확률 $P(B \mid A)$는 순서적으로 볼 때, 대부분 사건 $A$가 먼저 발생하고 $B$가 이어 발생하는 상황으로 $A$는 원인, ..

[통계학] 06-2. 조건부 확률 (2) - 독립사건

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 조건부확률의 특별한 형태인 독립사건의 정의와 관련 문제에 대해서 알아보겠습니다. 1. 독립사건 - independent events 이전에 공부했던 조건부확률을 이용하면 교사건을 연속적인 조건부확률의 곱으로 계산할 수 있음을 보았습니다. 어떤 특별한 조건에서는 위의 교사건이 개별 사건의 곱으로 표시되는 경우가 있습니다. 만약 사건 $A$가 사건 $B$의 발생에 영향을 주지 않는다면 $P(B \mid A) = P(B)$로 쓸 수 있습니다. 또한 사건 $B$가 사건 $A$에 영향을 주지 않는 다면 $P(A \mid B) = P(A)$로 쓸 수 있습니다. 이와 같..

[통계학] 06-1. 조건부 확률 (1) - 조건부 확률의 정의와 응용사례

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 조건부 확률의 정의와 조건부 확률에서 파생되는 주요 정리 및 응용사례에 대해 알아보겠습니다. 조건부 확률 문제 동전 두 개를 던지는 실험에서 어떤 한 동전이 앞면이라는 것을 알았을 때, 두 동전 모두 앞면일 사건의 확률을 구해 보겠습니다. 두 동전을 던지는 실험에서의 표본공간은 다음과 같습니다. 여기서 어떤 한 동전이 앞면이라는 정보가 추가로 주어지면 표본공간에서 {$TT$}가 발생할 수 없기 때문에 표본공간은 {$HH, TH, HT$} 으로 축소됩니다. 이 표본공간상에서 두 동전 모두 앞면일 사건의 확률은 1/3가 됩니다. 위의 문제에서와 같이 확률실험에서..

반응형