반응형

검정통계량 11

[통계학] 회귀분석 - 회귀계수(기울기)에 대한 통계적 추론 - MSE, 구간추정, 가설검정, 검정통계량

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 회귀계수(기울기)에 대한 통계적 추론 회귀계수 중 기울기에 해당하는 $\beta_1$의 중심축량, 구간추정, 가설검정에 대해 알아보겠습니다. 1. 기울기 $\beta_1$에 대한 추론 $\hat{\beta_1}$은 $\beta_1$의 추정값입니다. $\hat{\beta_1} = S_{xY}/S_{xx}$의 통계적 성질은 다음과 같습니다. $\hat{\beta_1}$의 기댓값은 다음과 같이 구할 수 있습니다. $\hat{\beta_1}$의 분산은 다음과 같습니다. $\hat{\beta_1}$의 기댓값과 분산을 구했으므로 $\hat{\beta_1}$는 다음과 같이 가정할 수 있습니다. 이를 표준화하면 중심축량을 구할 수 있습니다...

[통계학] 다변량 자료 - 산점도와 상관분석 - 표준상관계수, 상관분석 예제

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 수치변수들 간의 관계를 간단히 알아보는 방법을 알아보겠습니다. 회귀 분석을 공부하기 전에 다변량 자료가 무엇인지 복습을 해보도록 하겠습니다. 다변량 자료 - Multivariate Data 다변량 자료는 어떤 대상에 대해 여러 가지 변수들을 관측(측정)한 자료들의 집함을 의미합니다 예) 신체검사 자료에서 연령, 성별, 신장, 체중 시력, 혈액형 등등 자료의 형태를 보면 변수가 여러개 인것을 확인할 수 있습니다. 이를 다변량 자료라고 합니다. 변수가 하나면 일변량 자료 입니다. 각각의 관측값 간에는 관력성이 없습니다. 이는 독립적인 관측값을 의미합니다. 다음에 배울 회귀 분석에서는 독립적인 관측값을 가정합니다. 다변량 자료에서의..

[통계학] 일원배치 분산분석 - 고정효과모형 - 요인이 하나 수준은 임의적

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 요인이 하나이고 수준을 실험자가 결정하는 경우, 처리효과를 확인하기 위해 어떻게 모형을 설정하는지 알아보겠습니다. 고정효과 모형의 결과 해석과 어떤 모수에 대해 추론하는지 알아보겠습니다. 1. 일원배치 분산분석 일원배치 분산분석은 하나의 요인의 수준에 대한 평균을 비교하는 분석입니다. 실험 단위의 배치 또는 실험 순서에 있어 확률화의 원리에 충실해야 한다고 해서 완전 확률화 설계(completelt randomized design)라고도 합니다. 예제 4 종류의 사료(요인)에 의한 쥐 체중증가(반응변수) 실험에서 요인은 사료이고 수준은 사료 종류 수 4개 입니다. 쥐를 선정하고 할당하는 과정이 랜덤하게 이루어져야 합니다. 모든..

[통계학] 세 모집단의 평균 비교 - 다중검정의 문제점과 분산분석의 개념

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 독립 표본을 통해 분산이 같은 세 정규 모집단의 평균 비교하는 방법을 알아보겠습니다. 모든 조합에 대해 평균 차에 의한 가설검정으로 결과를 도출할 때 발생하는 문제에 대해 알아보겠습니다. 세 모집단 평균 비교 두 모집단의 경우 모평균의 차를 이용했지만 세 모집단의 경우는 검정통계량을 찾기 어렵습니다. 세 모집단의 평균 비교를 하는 방법으로 다중검정을 생각할 수 있습니다. 방법 1. 모든 쌍에 대해 t-검정 => 다중 검정 다중검정시에 유의수준 문제가 발생하게 됩니다. 하지만 다중검정시에 유의수준 문제가 발생하게 됩니다. 다중검정의 문제에 대해 알아보겠습니다. 다중검정을 통해 유의수준이 도출되었을 때 본페르니의 부등식에 의해 다..

[통계학] 두 모집단 비율 비교 - 가설검정방법, 대표본, 표본크기가 작은 경우

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. [통계학] 32. 두 모집단 비율 비교 - 비율 차, 구간 추정, 신뢰 구간, 중심축량 여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 두 모집단 비율 비교 독립표본을 통해 두 범주로 이루어진 두 모집단의 비율을 비교하는 방법을 deep-learning-study.tistory.com 저번 포스팅에서 정규분포로 가정간 두 모집단 비율 비교에서 신뢰구간을 구하는 법을 공부했습니다. 이번 포스팅에서는 가설검정방법에 대해 알아보겠습니다. 두 모집단 비율 비교 - 가설검정방법 대표본의 경우 비율차를 바탕으로 한 가설검정방법을 알아보겠습니다. 표본크크기가 크지 않는 경우 비율 비교에 대한 가설검정방법을 알..

[통계학] 30. 대응 표본을 통해 모집단의 평균을 비교하는 방법

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 두 모집단 평균 비교 대응표본을 통해 모집단의 평균을 비교하는 방법을 알아보겠습니다. 대응표본에서의 평균 차에 대한 중심축량과 이를 바탕으로 한 구간추정과 가설검정방법을 알아보겠습니다. 1. 대응표본을 통해 모집단의 평균비교 예시 약의 유효성 평가는 어떻게 하면 좋을까? 두 운동화의 내구성 비교를 어떻게 하면 좋을까? 이 두 가지 경우와 같은 상황일 때 대응표본을 통한 모집단의 평균을 비교할 수 있습니다. 동일한 개체를 대상으로 처리 전후를 비교하거나 유사한 두 대상을 쌍으로 만들어 서로 다른 처리하고 처리효과에 차이가 있는지를 알아봅니다. 관측값의 기저 차이에 의해 발생하는 변동을 제거하고 순수한 처리효과를 유도할 수 있습니..

[통계학] 29. 두 모집단 평균 비교 - 독립표본, 분산이 다른 경우

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 두 모집단 평균 비교 - 독립표본, 분산이 다른 경우 독립표본을 통해 분산이 다른 두 정규 모집단의 평균 비교하는 방법을 알아보겠습니다. 평균 차에 대한 중심축량과 이를 바탕으로 한 구간추정과 가설검정방법을 알아보겠습니다. 1. 정규모집단으로 가정한 경우 통계값 도출 (1) 두 개의 모집단에서 얻은 표본은 독립표본입니다. (2) 점추정은 표본평균의 차를 이용합니다. (3) 표본평균 차의 통계적 성질은 다음과 같습니다. (4) 정규확률변수의 선형결합도 정규분포를 따릅니다. 독립이기 때문에 공분산을 고려할 필요가 없습니다. (5) 표준화하면 다음과 같습니다. 2. 중심축량 구하기 두 모집단의 분산이 같은 경우와 다른 경우의 차이점..

[통계학] 29. 두 모집단 평균 비교 - 독립표본, 분산이 같은 경우

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 두 모집단 평균 비교 - 독립표본, 분산이 같은 경우 독립표본을 통해 분산이 같은 두 정규 모집단의 평균 비교하는 방법을 알아보겠습니다. 평균 차에 대한 중심축량과 이를 바탕으로 한 구간추정과 가설검정방법을 알아보겠습니다. 1. 두 모집단 비교에서의 가정 (1) 두 모집단 모두 정규 분포 형태를 갖는다. (2) 정규 분포라고 보기 어렵다. a. 표본크기가 큰 경우 정규 분포로 가정(대표본) b. 표본크기가 크지 않고 이상점이 존재(비 모수적 방법 이용) 크게 두 가지 경우로 가정해볼 수 있습니다. 2. 정규 모집단으로 가정한 경우 신뢰구간 신뢰구간 구하는 방법을 알아보겠습니다. 정규 모집단으로 가정한 경우 다음과 같습니다. 또..

[통계학] 26. 모비율에 대한 통계적 추론

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 구간추정에 기반한 표본크기결정 방법을 알아보겠습니다. 모비율 추론을 하는데 있어 주의해야 할 사항을 알아보겠습니다. 1. 모비율 추론 모비율을 추론할 때는 성공확률에 관심을 갖는 베르누이 확률을 이용합니다. 점추정량은 다음과 같이 구할 수 있습니다. 모비율($\theta$)를 표본비율(P)로 추정한 것입니다. 또한 평균과 같은 형태이므로 표본크기가 클 때 중심극한정리를 이용할 수 있습니다. 정규근사는 다음과 같은 조건이 있습니다. 2. 모비율의 구간추정 모비율의 구간추정하는 방법을 알아보겠습니다. (1) 중심축량을 구합니다. (2) 신뢰기준을 설정하고 신뢰구간을 구합니다. (3) 미지모수($\theta$)가 포함되어 있..

[통계학] 22. 유의확률(p-값)

(k-mooc 통계학의 이해2, 여인권)을 수강하면서 공부한 내용을 정리해보았습니다. 유의확률(p값)이 무엇이고 어떻게 사용하는지를 알아 보겠습니다. 1. 모평균의 검정방법 가정 : $X_1, X_2, ... , X_n$ ~ iid $N(\mu, \sigma^2), \sigma^2$는 알고 있음 가설설정 가설을 설정한 뒤에 추출한 표본의 표본평균의 중심축량을 구합니다. 중심축량에 귀무가설을 대입하여 검정통계량을 도출합니다. 유의수준을 설정하고 그에 따른 기각역을 도출할 수 있습니다. 검정통계량 값이 기각역에 포함되면 귀무가설을 기각합니다. 2. 예시문제 새로운 파이의 칼로리가 기존 칼로리 165kcal보다 낮다는 것을 보이기 위해 25개의 파이를 조사한다고 하겠습니다. 가정 : 칼로리 분포는 $N(\mu..

반응형