생각 작업실 The atelier of thinking

99. 반복이 있는 이원배치 분산분석 III 본문

통계학 이야기

99. 반복이 있는 이원배치 분산분석 III

knowledge-seeker 2024. 7. 22. 11:56

Chapter 99. 반복이 있는 이원배치 분산분석 III

 

이원배치 분산분석은 두 개의 설명(독립)변수(요인)가 있는 경우에 적용됩니다. 이 요인들의 각 수준 조합에 대한 종속변수의 평균 차이를 비교합니다.
요인(설명변수,독립변수)이 두 개이고 각 처리(수준)에 하나의 관측값(반응변수,종속변수)이 있는 경우 각 요인의 처리 효과를 확인하기 위한 모형을 설정합니다.

 

 

반복이 있는 이원배치 분산분석의 모형식은 아래와 같습니다.

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$

각 항은 아래와 같습니다.

$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $
$\alpha_i : $ 요인 A의 i 번째 처리효과
$\beta_j :$ 요인 B의 j 번째 처리효과(주효과)
$(\alpha \beta)_{ij} : $ 요인 A 와 B의 상호작용

 


1. 혼합 효과 모형

 

혼합효과모형은 고정효과모형과 변량효과모형의 특성을 혼합한 모형입니다. 이 모형은 하나의 요인은 고정효과로 취급하고 다른 요인은 변량효과로 취급합니다.

위 모형에서 요인 A는 고정효과모형을 요인 B는 변량효과모형을 따른다고 했을 때, 모형식은 아래와 같이 나타낼 수 있습니다.

 

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$


각 항에 대하여 아래와 같이 나타낼 수 있습니다.

 

$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $
$\alpha_i : $ 요인 A의 i 번째 처리효과(주효과) , $\sum \alpha_i = 0$
$\beta_j \sim iid N(0, \sigma_B^2)$ 요인 B의 j 번째 처리효과 , 확률변수
$(\alpha \beta)_{ij} \sim iid N(0, \sigma_{AB}^2 $ 요인 A 와 B의 상호작용


상호작용효과는 확률변수라 할 수 있습니다.

 


 

2. 혼합효과 모형식의 특징

 

위 모형식에서 요인 A는 고정효과모형으로 상수로 나타나고, 요인 B는 확률변수, 상호효과역시 확률변수이므로 아래와 같은 성질을 가지게 됩니다.

 

$$E(Y_{ijk}) = \mu $$
$$Var(Y_{ijk}) =  \sigma_B^2 + \sigma_{AB}^2 + \sigma^2 $$

 

각 요인에서의 공분산은 아래와 같이 추론할 수 있습니다.

 

$$Cov(Y_{ijk}, Y_{ijk'}) = \sigma_B^2 + \sigma_{AB}^2 $$
$$Cov(Y_{ijk}, Y_{i'jk'}) = \sigma_B^2 - \sigma_{AB}^2/(p-1) $$
$$Cov(Y_{ijk}, Y_{i'j'k'}) = 0 $$

 


 

3. 평균제곱(MS)의 기대값

 

$E(MSE) = \sigma^2$

$E(MS(AB)) = \sigma^2 + np\sigma_{AB}^2/(p-1)$

$\implies  MSE$에 비해 $MS(AB)$가 크면 클수록 $\sigma_{AB}^2 > 0$일 가능성이 높습니다.

 

$E(MSA) = \sigma^2 + n\sigma_{AB}^2/(p-1) + nq\sum_{i=1}^p \alpha_i^2/(p-1)$

$E(MSB) = \sigma^2 + np\sigma_B^2$

$\implies  MSE$와 $MSA$ 또는 $MSB$ 를 직접 비교하기는 곤란합니다.

$\implies  MS(AB)$에 비해 $MSA$가 크면 클수록 $\alpha_i^2 \not= 0$일 가능성이 높습니다.

 

$\implies  MS(AB)$에 비해 $MSB$가 크면 클수록 $\sigma_B^2>0$일 가능성이 높습니다.

 


 

4. 혼합 효과 모형 분산분석표

 

요인 A의 처리효과를 확인하기 위한 F-통계량은 MSE 대신에 MS(AB)를 사용하고, 요인 B의 처리효과를 확인하기 위한 F-통계량은 그대로 MSE를 사용합니다.

 

변동요인 자유도 제곱합 평균제곱 F-통계량
처리 A(고정) p-1 SSA MSA MSA/MS(AB)
처리 B(변량) q-1 SSB MSB MSB/MSE
 상호작용 (p-1)(q-1) SS(AB) MS(AB) MS(AB)/MSE
오차 pq(n-1) SSE MSE  
전체 N-1 TSS    

 

상호작용효과가 유의하지 않으면 오차에 흡수시켜 다시 분석합니다.
상호작용효과가 유의하면 주효과가 유의하지 않더라도 모형을 유지합니다.

 


5. 모수 추정

 

(1) 상호 작용 효과의 분산

 

$$E(MSE) = \sigma^2$$
$$E(MS(AB)) = \sigma^2 + np\sigma_{AB}^2/(p-1) $$
$$\implies np\sigma_{AB}^2/(p-1)= E(MS(AB)) - E(MSE) $$
$$\sigma_{AB}^2 = \frac{(p-1)}{np} (E(MS(AB)) - E(MSE)) $$

 

(2) 요인 A의 처리효과 구간추정

 

고정효과모형에서의 모수는 평균의 차이입니다.

$\mu(A_i)$의 구간 추정은 아래와 같이 할 수 있습니다.

 

$$ \bar{Y}_{i++} \pm t_{\alpha/2 , (p-1)(q-1)} \sqrt{MS(AB)/nq} $$

 

(3) 요인 B의 처리효과 분산추정

 

변량효과모형에서의 모수는 분산입니다.

 

$$E(MSB) = \sigma^2 + np\sigma_B^2$$

$$\implies np\sigma_B^2 = E(MSB) - E(MS(AB))$$

$$\sigma_B^2 = \frac{E(MSB) - E(MS(AB))}{np}$$