생각 작업실 The atelier of thinking

98. 반복이 있는 이원배치 분산분석 II 본문

통계학 이야기

98. 반복이 있는 이원배치 분산분석 II

knowledge-seeker 2024. 7. 18. 11:44

Chapter 98. 반복이 있는 이원배치 분산분석 II

이원배치 분산분석은 두 개의 설명(독립)변수(요인)가 있는 경우에 적용됩니다. 이 요인들의 각 수준 조합에 대한 종속변수의 평균 차이를 비교합니다.
요인(설명변수,독립변수)이 두 개이고 각 처리(수준)에 하나의 관측값(반응변수,종속변수)이 있는 경우 각 요인의 처리 효과를 확인하기 위한 모형을 설정합니다.

 

 

반복이 있는 이원배치 분산분석의 모형식은 아래와 같습니다.

 

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$

각 항은 아래와 같습니다.

$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $
$\alpha_i : $ 요인 A의 i 번째 처리효과
$\beta_j :$ 요인 B의 j 번째 처리효과(주효과)
$(\alpha \beta)_{ij} : $ 요인 A 와 B의 상호작용


1. 변량효과모형

 

변량효과모형은 각 처리 수준의 평균이 모집단에서 무작위로 추출된 것으로 간주합니다. 수준의 평균들과 오차항 및 상호작용효과 역시 확률변수로 표현할 수 있습니다.

 

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$

$$ \alpha_1, \beta_j, (\alpha \beta)_{ij}, \epsilon_{ijk} \implies  확률변수$$


각 항은 정규분포를 따른다고 가정합니다.

 

$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim iid N(0, \sigma^2) $
$\alpha_i \sim iid N(0, \sigma_A^2) : $ 요인 A의 i 번째 처리효과
$\beta_j \sim iid N(0, \sigma_B^2):$ 요인 B의 j 번째 처리효과(주효과)
$(\alpha \beta)_{ij} \sim N(0,\sigma_{AB}^2 ) : $ 요인 A 와 B의 상호작용

 


 

2. 변량효과모형식의 특징

 

위 모형식은 확률변수이므로 아래와 같은 특징을 가지게 됩니다.

 

$$E(Y_{ijk}) = \mu $$

$$Var(Y_{ijk}) = \sigma_A^2 + \sigma_B^2 + \sigma_{AB}^2 + \sigma^2 $$


각 요인에서의 공분산은 아래와 같이 추론할 수 있습니다.

 

$$Cov(Y_{ijk}, Y_{ijk'}) = \sigma_A^2 + \sigma_B^2 + \sigma_{AB}^2 $$

$$Cov(Y_{ijk}, Y_{ij'k'}) = \sigma_A^2  $$

$$Cov(Y_{ijk}, Y_{i'jk'}) = \sigma_B^2 $$

$$Cov(Y_{ijk}, Y_{i'j'k'}) = 0 $$

 


 

3. 평균제곱(MS)의 기대값

 

$$\epsilon_{ijk} \sim iid N(0, \sigma^2) $$

$$\alpha_i \sim iid N(0, \sigma_A^2) \implies H_{A0} : \sigma_A^2 = 0 $$

$$\beta_j \sim iid N(0, \sigma_B^2) \implies H_{B0} : \sigma_B^2 = 0 $$

$$(\alpha \beta)_{ij} \sim N(0,\sigma_{AB}^2 ) \implies H_{AB0} : \sigma_{AB}^2 = 0 $$

 

요인 A, 요인 B, 상호작용에 대한 가설 설정은 위와 같이 할 수 있습니다.

이 때, 평균제곱의 기대값은 아래와 같이 나타낼 수 있습니다.

 

$E(MSE) = \sigma^2$

$E(MS(AB)) = \sigma^2 + n\sigma_{AB}^2$

$\implies  MSE$에 비해 $MS(AB)$가 크면 클수록 $\sigma_{AB}^2 > 0$일 가능성이 높습니다.

 

$E(MSA) = \sigma^2 + n\sigma_{AB}^2 + nq\sigma_A^2$

$E(MSB) = \sigma^2 + n\sigma_{AB}^2 + np\sigma_B^2$

$\implies  MSE$와 $MSA$ 또는 $MSB$ 를 직접 비교하기는 곤란합니다.

$\implies  MS(AB)$에 비해 $MSA(MSB)$가 크면 클수록 $\sigma_{AB}^2 > 0(\sigma_B^2>0)$일 가능성이 높습니다.

 


 

4. 변량효과모형 분산분석표

 

요인 A, 요인 B의 처리효과를 확인하기 위한 F-통계량은 MSE 대신에 MS(AB)를 사용하게 됩니다.

 

변동요인 자유도 제곱합 평균제곱 F-통계량
처리 A p-1 SSA MSA MSA/MS(AB)
처리 B q-1 SSB MSB MSB/MS(AB)
 상호작용 (p-1)(q-1) SS(AB) MS(AB) MS(AB)/MSE
오차 pq(n-1) SSE MSE  
전체 N-1 TSS    

 


 

5. 분산추정 - 상호작용효과가 유의한 경우

 

(1) 상호작용효과의 분산추정

 

$$E(MSE) = \sigma^2$$

$$E(MS(AB)) = \sigma^2 + n\sigma_{AB}^2$$

$$\implies n\sigma_{AB}^2 = E(MS(AB)) - E(MSE) $$

$$\sigma_{AB}^2 = \frac{E(MS(AB)) - E(MSE)}{n}$$

 


(2) 요인 A 처리효과의 분산추정

 

$$E(MSA) = \sigma^2 + n\sigma_{AB}^2 + nq\sigma_A^2$$

$$\implies nq\sigma_A^2 =E(MSA) - E(MS(AB))$$

$$\sigma_A^2 = \frac{E(MSA) - E(MS(AB))}{nq}$$

 


(3) 요인 B 처리효과의 분산추정

 

$$E(MSB) = \sigma^2 + n\sigma_{AB}^2 + np\sigma_B^2$$

$$\implies np\sigma_B^2 =E(MSB) - E(MS(AB))$$

$$\sigma_B^2 = \frac{E(MSB) - E(MS(AB))}{np}$$