반응형

분류 전체보기 823

[통계학] 09-2. 이항분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 대표적인 이산분포인 이항분포의 성질에 대해 알아보겠습니다. 1. 이항분포 - Binimial distribution 성공확률인 $p$인 베르누이시행을 $n$번 반복했을 때 성공 횟수($X$)의 분포를 이항분포라고 합니다. $X_i ~ B(p)$라고 할 때, 확률변수 $X$는 $n$개의 베르누이시행에서 성공한 횟수를 의미합니다. 확률변수 $X$는 $n$개의 베르누이 확률변수의 합으로 $X$의 기댓값은 베르누이확률변수의 기댓값의 합으로 표시됩니다. 베르누이확률변수는 서로 독립이기 때문에 $X$의 분산도 다음과 같이 각각의 베르누이 분산의 합으로 표시합니다. 표준..

[통계학] 09-1. 베르누이 시행, 베르누이 확률변수, 베르누이 분포

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 1. 베르누이 시행 - Bernoulli trial 베르누이 시행의 세가지 조건이 있습니다. 예를 들어, 10개의 제품 중 7개가 정상, 3개가 불량품일때, 불량품이 뽑힌 것을 (S)라고 하겠습니다. 복원추출과 비복원추출 방법으로 각각 제품을 뽑았을 때 2개 모두 불량품일 확률은 다음과 같습니다. 2개를 복원추출하는 경우는 불량품이 뽑힐 확률이 항상 3/10이기 때문에 베르누이시행이라고 할 수 있습니다. 하지만 비복원추출의 경우 두 번째 추출은 첫 번째 추출결과에 영향을 받기 때문에 베르누이시행이라고 할 수 없습니다. 만약 상자에 10000개의 제품이 있고 ..

[통계학] 08-3. 확률벡터(3) - 기댓값, 공분산, 상관계수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 두 개 이상의 확률변수에 대한 기댓값 계산 방법을 알아보겠습니다. 두 변수의 직선관계 정도를 나타내는 공분산과 상관계수를 계산하고 독립일 때 이들 값이 0인 것을 보입니다. 두 변수의 선형결합과 관련된 평균과 분산의 성질에 대해 알아보겠습니다. 1. 기댓값 - expected value 두 확률변수 $X$와 $Y$에 대해 $X + Y$나 $XY$의 기댓값은 어떻게 계산해야 할까? 기댓값은 확률변수가 가질 수 있는 값에 해당 확률을 곱하여 다 더한 것으로 정의 했습니다. 두 확률변수의 기댓값은 이들 변수가 가질 수 있는 값에 해당 확률, 즉 결합확률질량함수를 ..

[통계학] 08-2. 확률벡터(2) - 결합분포, 주변분포, 독립확률변수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 두 확률변수의 확률구조를 설명하기 위한 결합분포와 주변분포에 대해 알아보겠습니다. 결합분포와 주변분포의 관계로부터 두 확률분포가 독립인지 아닌지를 확인하는 방법을 알아보겠습니다. 1. 확률벡터 - random vector 확률벡터: 확률변수를 순서열 $(X_1, X_2, ... ,X_p)$로 표시한 것을 확률벡터라고 합니다. 설명 자료를 수집할 때 특정 변수 하나만 관심을 가질 수 있으나 여러 가지 변수의 자료를 얻고 이들 변수들 간에 어떤 관계가 있는지 관심을 가질 수도 있습니다. 아이돌 가수 프로필 자료에서 신장, 체중 등의 여러 변수에 대한 자료를 수집..

[통계학] 08-1. 확률벡터(1) - 분산과 표준편차

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 모집단의 분포가 얼마나 퍼져있는지를 나타내는 분산 및 표준편차의 계산과 성질에 대해 알아보겠습니다. 1. 분산 표본평균은 자료의 중심위치를 의미하며, 분산과 표준편차는 자료가 얼마나 펴져 있는가에 대한 통계값입니다. 분산을 식으로 표기하면 다음과 같습니다. 이를 간편식으로 나타내면 다음 식이 됩니다. 위의 식이 어떻게 도출되었는지 알아보도록 하겠습니다. 표본크기가 n개가 있고 자료가 k개가 있어 이들 값을 $x_1, ... , x_2$라고 하겠습니다. $n_i$는 표본 중 $x_i$값을 가지는 표본수라고 하겠습니다. 값이 중복되는 자료가 있기 때문에 n > ..

[통계학] 07-5. 확률변수의 기댓값 - 기댓값의 성질

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 다양한 확률 및 통계문제를 해결하기 위해 기댓값의 성질에 대해 알아보도록 하겠습니다. 1. 기댓값 - expected value 기댓값은 확률변수에 대해 평균적으로 기대하는 값이라는 의미를 갖은 용어로 평균과 같은 개념입니다. 그래서 $X$의 평균을 $X$의 기댓값이라고 하고 $E(X)$로 표시합니다. 즉 $E(X) = \mu $가 됩니다. 기댓값을 설명하기 위해 모평균을 설명하도록 하겠습니다. 모평균은 표본평균에서 표본크기 n을 계속 크게하여 통계적 확률의 관점에서 볼 때 표본들은 모집단으로, 표본평균은 모평균으로 수렴한 것을 의미합니다. 모평균을 설명하기..

[통계학] 07-4. 연속확률변수와 확률밀도함수

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 연속확률변수의 확률구조를 나타내는 확률밀도함수와 그 성질에 대해 알아보겠습니다. 1. 확률밀도함수 - pdf, probability density function 아래의 그림 처럼 연속확률변수 $X$의 분포형태, 즉 모집단의 형태를 나타낸 것으로 임의의 점 $x$에서의 밀도를 $f(x)$라고 표시하면 $f(x)$를 확률밀도함수라고 합니다. 히스토그램은 자료들을 적절한 구간으로 나누고 각 구간에 포함되어 있는 자료의 상대도수를 면적으로 표시한 것으로 전체 면적은 1이 됩니다. 이때 해당 구간의 높이를 밀도하고 했습니다. 이 밀도는 해당 구간에 상대적으로 얼마나..

[통계학] 07-3. 이산확률변수와 확률질량함수 (확률질량함수의 성질, 확률함수의 변환, 누적분포함수)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 이산확률변수의 확률구조를 나타내는 확률질량함수의 성질에 대해 알아보겠습니다. 1. 확률질량함수 - probability mass function 이산확률변수는 확률변수의 치역이 셀 수 있는 경우를 의미합니다. 이산확률변수 $X$가 임의의 값 $x$일 확률 $P(X = x)$를 $x$에 대한 함수로 생각하면 다음과 같이 됩니다. 이때 $f(x)$를 확률변수 $X$의 확률질량함수라고 합니다. 예시문제 동전을 세 번 던졌을 때 앞면의 수를 $X$라고 하면 $X$가 가질 수 있는 값은 $x$ = 0, 1, 2, 3이고 이에 대한 확률질량 함수는 다음과 같습니다. 앞..

[통계학] 07-2. 확률분포, 확률분포표

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 확률변수의 값에 대해 확률을 표시한 확률분포에 대해서 알아보도록 하겠습니다. 1. 확률분포 - probability distibution 확률분포는 확률변수의 값에 대해 확률을 표시한 것입니다. 확률분포는 우리가 관심을 가지는 모집단의 확률구조를 나타냅니다. 확률분포를 설명하기 위해 확률변수의 정리를 복습해보도록 하겠습니다. 확률변수는 표본공간의 값을 숫자로 바꾼 함수이기 때문에 어떤 확률변수 $X$가 임의의 $x$값을 가진다는 것은 표본공간 내에 대응하는 원소들이 존재합니다. 즉, $X = x$이면 표본공간에서 {$w\mid X(w) = x, w\in$Ω}..

[통계학] 07-1. 확률변수의 정의와 종류 (이산확률변수, 연속확률변수)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 통계학에서 가장 중요한 확률변수에 대해 알아보겠습니다. 확률변수가 무엇인지 알아보고 확률변수의 두 가지 종류에 대해서 알아보겠습니다. 우리가 경험하는 대부분의 사회, 자연적 현상은 불확실성을 가지고 있기 때문에 완벽하게 설명되지 않고 어떤 결과가 나올지 예측하기 어렵습니다. 완벽하게 설명할 수 없거나 예측할 수 없다는 것은 확률실험이 가지는 성질 중 하나입니다. 통계학에서는 이런 불확실한 현상을 일종의 확률실험으로 봅니다. 확률실험의 불확실성을 효과적으로 분석하기 위해 통계학에서는 표본공간의 원소를 숫자로 바꾸어 확률실험을 수리적으로 모형화할 수 있도록 합니..

반응형