반응형

수학/기초 통계학 81

[통계학] 확률화 블록 계획법 - 이원배치 분산분석과의 차이점과 분석결과 해석 방법

여인권 교수님의 KMOOC 강의 "통계학의 이해 2"를 수강하면서 공부한 내용을 정리해보았습니다. 확률화블록설계의 개념과 단순 이원배치 분산분석과의 차이점을 알아보겠습니다. 확률화블록설계에 의한 분석결과를 어떻게 해석해야 하는지 알아보겠습니다. 확률화 블록 계획법 블록(block)은 요인의 처리 효과를 비교하는데 정확도를 높이기 위해 예비 지식을 이용하여 나눈 동일적인 실험 단위를 의미합니다. 예를 들어 수준(처리)는 처치 방법(관심 요인)이면 블록은 성별 또는 연령으로 구분할 수 있습니다. 쌍을 이룬 비교의 일반화(대응표본의 일반화)를 한 것입니다. 블록은 차이가 있다고 가정하므로 가설검정을 하지 않습니다. 1. 실험설계 p개의 수준(처리)과 b개의 블록이 있다고 가정하겠습니다. 각 블록 안에서 처리 ..

[통계학] 변량효과모형과 혼합효과모형의 모형식과 통계적 추론 - 이원배치 분산분석 - 반복이 없는 경우

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 변량효과모형과 혼합효과모형에서의 가정과 모형식을 알아보겠습니다. 변량효과모형과 혼합효과모형에서 주요 모수에 대한 통계적 추론 방법을 알아보겠습니다. 변량효과모형 - Random Effect Model (1) 모형식 설계 이원배치 분산분석에서의 변량효과모형의 모형식은 다음과 같이 설계할 수 있습니다. (2) 변량효과모형 가정 변량효과모형은 다음과 같이 가정할 수 있습니다. (3) 가설검정 변량효과모형에서의 평균은 확률변수입니다. 따라서 분산에 관심이 있습니다. 가설검정은 다음과 같이 설정할 수 있습니다. (4) 분산분석표 유의하지 않는 요인의 처리효과는 오차에 흡수시켜 다시 분석합니다. (5) 처리수준 분산 추정 MSE, MSA..

[통계학] 고정효과모형의 모형식과 통계적 추론 - 이원배치 분산분석, 반복이 없는 경우

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 요인이 두 개이고 각 처리에 하나의 관측값이 있는 경우, 각 요인의 처리효과를 확인하기 위해 어떻게 모형을 설정하는지 알아보겠습니다. 고정효과 모형 하에서의 통계적 추론을 알아보겠습니다. 이원배치 분산분석 이원배치 분산분석의 실험을 설계하면 다음과 같습니다. 요인 A의 수준 수는 p, 요인 B의 수준 수는 q일 때 p X q 처리를 완전 확률화 하여 실험을 진행한다고 가정하겠습니다. 자료구조는 다음과 같이 확인할 수 있습니다. 여기서 요인A와 요인B가 있는데, 두 요인 모두 실험자가 결정하는 것을 고정효과모형(fixed effect models) 두 요인 모두 무작위로 선택하는 것은 변량효과모형(random effect mod..

[통계학] 분산분석 - 선형대비 - 수준 평균의 선형 결합 형태

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 처리효과가 있다고 할 때, 수준 평균의 선형 결합 형태의 가설에 대한 검정 방법을 알아보겠습니다. 1. 선형대비 - Linear Contrast 선형대비는 고정효과모형에서만 이용할 수 있는 방법입니다. 선형대비는 계수의 합이 0인 $\mu_i$의 선형결합을 의미합니다. $\mu_L$의 추정은 모평균을 표본평균으로 바꾸어 표현할 수 있습니다. L은 정규분포를 따른다고 가정하면 분산과 분산의 추정량은 다음과 같습니다. 분산의 추정량을 구했으므로 중심축량을 도출할 수 있습니다. 가설검정 선형대비에서 귀무가설을 다음과 같이 설정합니다. 중심축량에서 귀무가설을 대입하여 검정통계량을 도출합니다. 검정통계량은 자유도가 N-p인 t분포를 따..

[통계학] 분산분석 - 다중비교 - Fisher LSD, Bonferroni, Scheffe, Tukey HSD

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 처리효과가 있다고 할 때, 어떤 수준들 간에 차이가 있는지 확인하기 위해 모든 평균 차의 조합에 대해 유의성을 검정하는 방법을 알아보겠습니다. 다중비교 - Multiple comparison 분산분석 고정효과모형 가설검정을 통해 처리효과가 있다고 판단될때 다중비교를 통해 어떤 수준들 간에 차이가 있는지 확인할 수 있습니다. 모든 그룹의 평균에 대해 검정하는 방법입니다. 다중비교 방법은 여러가지가 있습니다. 여기서 배워볼 방법은 Fisher's LSD, Bonferroni's MSD, Scheffe, Tukey HSD 방법입니다. 1. Fisher's least significant difference - 최소유의차 방법, LS..

[통계학] 분산분석 - 등분산성 검정 - 잔차그림, Hartley 검정, Bartlett 검정

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 분산분석에서의 통계적 추론을 하는데 필요한 가정에 대해 알아보겠습니다. 분산분석에서 가정한 조건을 분석자료들이 만족하는지 확인하는 방법을 알아보겠습니다. 모형 가정 분산 분석에서 가장 중요한 것이 모형식이 등분산성을 만족하냐가 중요합니다. 모형식이 다음과 같이 주어졌을 때 1. 등분산성 2. 정규성 - Shapiro-Wilk, jarque-bera 등등 3. 독립성 세 가지를 검정해야 합니다. 등분산성 검정 등분산성 검정은 가설검정으로 구할 수 있습니다. 귀무가설과 대립가설을 다음과 같이 설정합니다. 반복수가 같은 경우 동일한 분산을 가진다는 가정을 약간 어기는 것에 대해 분산분석 방법은 robust한 편입니다. 이는 검정을 ..

[통계학] 분산분석표, 고정효과모형과 변량효과모형에서 F통계량의 분모와 분자인 평균제곱의 통계적 성질

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 자료들의 변동을 요소별로 분해하여 정리한 분산분석표에 대해 알아보겠습니다. 고정효과모형과 변량효과모형에서 F통계량의 분모와 분자인 평균제곱의 통계적 성질을 알아보겠습니다. 변동분해 모형식을 정리하여 변동을 요소별로 분해할 수 있습니다. 모형식이 다음과 같을때, TSS(변동), SSE(잔차제곱합), SSTR(처리제곱합) 으로 분해할 수 있습니다. $\mu$는 평균, $\alpha$는 처리효과, $\epsilon$은 오차를 의미합니다. 모형식을 정리하면 다음과 같이 표현할 수 있습니다. 이 식을 제곱한 값을 모두 더해주면 다음과 같이 됩니다. 이 식을 정리하면 세 가지 변동으로 분해됩니다. SSE + SSTR = TSS가 됩니다...

[통계학] 분산분석 - 변량효과모형 - 요인이 하나, 수준을 무작위

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 요인이 하나이고 수준을 무작위로 선택한 경우, 처리효과를 확인하기 위해 어떻게 모형을 설정하는지 알아보겠습니다. 변량효과 모형의 결과 해석과 어떤 모수에 대해 추론하는지 알아보겠습니다. 변량효과모형 - Random Effect Models 변량효과모형은 분석에 적용할 수준 집합으로부터 무작위로 선택하는 것입니다. 분석 결론은 선택된 수준뿐만 아니라 수준 집합 내의 모든 수준으로 확대될 수 있습니다. 수준 모집단과 각 수준별 관측단위 모집단이 있습니다. 몇개의 고등학교가 수준의 모집단을 대표하고 무작위로 선택한 학생이 관측단위의 모집단을 대표할 수 있습니다. (1) 수준들의 모집단 수준들의 모집단은 비교 대상인 수준들의 집합으로..

[통계학] 일원배치 분산분석 - 고정효과모형 - 요인이 하나 수준은 임의적

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 요인이 하나이고 수준을 실험자가 결정하는 경우, 처리효과를 확인하기 위해 어떻게 모형을 설정하는지 알아보겠습니다. 고정효과 모형의 결과 해석과 어떤 모수에 대해 추론하는지 알아보겠습니다. 1. 일원배치 분산분석 일원배치 분산분석은 하나의 요인의 수준에 대한 평균을 비교하는 분석입니다. 실험 단위의 배치 또는 실험 순서에 있어 확률화의 원리에 충실해야 한다고 해서 완전 확률화 설계(completelt randomized design)라고도 합니다. 예제 4 종류의 사료(요인)에 의한 쥐 체중증가(반응변수) 실험에서 요인은 사료이고 수준은 사료 종류 수 4개 입니다. 쥐를 선정하고 할당하는 과정이 랜덤하게 이루어져야 합니다. 모든..

[통계학] 분산분석에서의 용어와 개념 - 실험계획법, 설명변수, 공변량, 요인, 반응변수, 처리, 수준

여인권 교수님의 KMOOC 강의 를 수강하면서 공부한 내용을 정리해보았습니다. 실험계획법(Experiment Design, 실험설계법) 여러 모집단의 평균을 비교하는 것이 분산분석입니다. 이와 마찬가지로 단일모집단에서 특성을 나뉘어 여러 그룹으로 나눌 수 있습니다. 실험계획법이란 동일 그룹을 대상으로 다른 환경(조건)으로 나누어 실험을 진행한 환경(조건)에 따라 관심모수(평균)을 비교합니다. 예를 들어, 사료에 따라 체중 증가량에 차이가 있는지를 알아보기 위해 비슷한 쥐들을 무작위로 뽑아 각각 다른 사료를 일정기간 먹이고 체중 증가량을 비교합니다. 이를 실험계획법이라고 합니다. 분산분석에서의 주요용어 분산분석에서의 주요용어를 알아보겠습니다. 1. 반응변수(response variable) : 연구 대상이..

반응형