생각 작업실 The atelier of thinking

97. 반복이 있는 이원배치 분산분석 I 본문

통계학 이야기

97. 반복이 있는 이원배치 분산분석 I

knowledge-seeker 2024. 7. 17. 16:44

Chapter 97. 반복이 있는 이원배치 분산분석 I

 

이원배치 분산분석은 두 개의 설명(독립)변수(요인)가 있는 경우에 적용됩니다. 이 요인들의 각 수준 조합에 대한 종속변수의 평균 차이를 비교합니다.
요인(설명변수,독립변수)이 두 개이고 각 처리(수준)에 하나의 관측값(반응변수,종속변수)이 있는 경우 각 요인의 처리 효과를 확인하기 위한 모형을 설정합니다.

 

 

1. 자료구조

 

반복이 있는 경우의 자료구조는 아래와 같습니다.

 

요인 1 요인 2
1 2 ... q
1 $Y_{111}$
$Y_{112}$
...
$Y_{11n}$
$Y_{121}$
$Y_{122}$
...
$Y_{12n}$
... $Y_{1q1}$
$Y_{1q2}$
...
$Y_{1qn}$
2 $Y_{211}$
$Y_{212}$
...
$Y_{21n}$
$Y_{221}$
$Y_{222}$
...
$Y_{22n}$
... $Y_{2q1}$
$Y_{2q2}$
...
$Y_{2qn}$
... ... ... ... ...
p $Y_{p11}$
$Y_{p12}$
...
$Y_{p1n}$
$Y_{p21}$
$Y_{p22}$
...
$Y_{p2n}$
... $Y_{pq1}$
$Y_{pq2}$
...
$Y_{pqn}$

 

2. 모형식

 

이원배치 분산분석에서 반복이 없는 경우, 각 요인이 두 개이고 각 처리에 반복하여 관측값이 있는 경우, 모형은 다음과 같이 설정됩니다.

 

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$


각 항은 아래와 같습니다.

 

$\mu :$ 전체평균

$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $

$\alpha_i : $ 요인 A의 i 번째 처리효과

$\beta_j :$ 요인 B의 j 번째 처리효과(주효과)

$(\alpha \beta)_{ij} : $ 요인 A 와 B의 상호작용


반복이 없는 이원배치 분산분석의 모형식과 다른 점은 상호작용이 발생한다는 것입니다.

 


 

3. 상호작용

 

상호작용효과란 한 요인의 효과가 다른 요인의 수준에 따라 달라지는 경우를 의미합니다. 즉, 두 요인 간의 상호작용이 존재할 때 각 요인의 효과가 서로 영향을 주고받는 것을 나타냅니다.

상호작용이 없는 경우를 상호작용도표으로 나타내면,

 

(1) 요인 A, 요인 B 모두 효과가 없을때

 

 

각 요인내 수준의 평균이 비슷하게 나타납니다.

 

(2) 요인 A 처리효과 없고, 요인 B 처리효과 있을 때

 

 

요인A의 수준들의 평균은 차이가 없지만 요인 B의 수준들의 평균은 차이가 있습니다.

 

(3) 요인 A 처리효과 있고, 요인 B 처리효과 없을 때

 

요인A의 수준들의 평균은 차이가 있지만 요인 B의 수준들의 평균은 차이가 없습니다.

 

(4) 요인 A와 요인 B 모두 처리효과가 있을때

 

 

요인 A와 요인 B의 수준들의 평균의 차이가 나타납니다.

위의 4 가지 경우는 모두 평균의 차이로 처리효과 여부를 알 수 있습니다. 하지만, 아래의 경우는 평균의 차이로 처리효과를 알 수 없습니다.

 

(5) 평균의 차이로 처리효과 여부를 알 수 없을 때

 

위 경우는 평균의 차이로만으로는 처리효과 여부를 알 수 없습니다. 이를 보완하기 위해 추가하는 것이 상호작용입니다.

 


상호작용이 있는 경우, 두 요인의 효과를 독립적으로 분석하는 것만으로는 실험의 결과를 올바르게 해석할 수 없습니다. 상호작용이 없는 경우에만 각 요인의 효과를 독립적으로 분석할 수 있습니다. 상호작용을 고려하지 않으면 실험 결과의 해석이 오용될 수 있으며, 상호작용이 없다고 가정한 모델이 데이터와 일치하지 않을 수 있습니다.

따라서 이원배치 분산분석을 수행할 때는 상호작용 효과를 고려하여 모델링하는 것이 중요합니다. 상호작용이 있는 경우에는 적절한 모델링을 통해 상호작용 효과를 포착하고 실험 결과를 정확하게 해석할 수 있습니다.

 


 

4. 고정효과모형

 

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$

 

위 반복이 있는 이원배치 분산분석 모형식을 고정효과모형에서는 아래와 같이 나타낼 수 있습니다.

 

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$

$$ = \mu + (\mu_{i+}-\mu) + (\mu_{+j}-\mu) + (\mu_{ij}-\mu_{i+}-\mu_{+j}+\mu) + \epsilon_{ijk}$$

 

(1) 변동분해

 

 

위 모형식을 변동분해하면 아래와 같이 나타낼 수 있습니다.

 

$$Y_{ijk} - \mu = (\mu_{i+}-\mu) + (\mu_{+j}-\mu) + (\mu_{ij}-\mu_{i+}-\mu_{+j}+\mu) + \epsilon_{ijk}$$


$\mu$ 대신 추정치$(Y)$를 사용하여 나타내면,

 

$$Y_{ijk} - \bar{Y} = (\bar{Y}_{i++}-\bar{Y}) + (\bar{Y}_{+j+}-\bar{Y}) + (\bar{Y}_{ij+}-\bar{Y}_{i++}-\bar{Y}_{+j+}+\bar{Y}) + Y_{ijk} - \bar{Y}_{ij+}$$


위 식을 제곱합으로 각 항을 분리해보면 아래와 같습니다.

 

$ TSS : \sum_{i=1}^p \sum_{j=1}^q \sum_{k=1}^n (Y_{ijk}+\bar{Y})^2$, 자유도는 $N-1$

$ SSA : nq \sum_{i=1}^p (\bar{Y}_{i++} - \bar{Y})^2$, 자유도는 $p-1$

$ SSB : np \sum_{j=1}^q (\bar{Y}_{+j+} - \bar{Y})^2$, 자유도는 $q-1$

$ SS(AB) : n \sum_{i=1}^p \sum_{j=1}^q (\bar{Y}_{ij} - \bar{Y}_{i++} - \bar{Y}_{+j+} +\bar{Y})^2$, 자유도는 $(p-1)(q-1)$

$ SSE : \sum_{i=1}^p \sum_{j=1}^q \sum_{k=1}^n (Y_{ijk} - \bar{Y}_{ij+})^2$, 자유도는 $pq(n-1)$


처리효과만 따로 나타낸다면,

 

$ SSTR : n \sum_{i=1}^p \sum_{j=1}^q (\bar{Y}_{ij+} - \bar{Y})^2$, 자유도는 $pq-1$

$ SSTR = SSA + SSB + SS(AB)$

$ TSS = SSTR + SSE $

 

(2) 분산분석표

 

위 변동분해를 분산분석표로 나타내면 아래와 같습니다.

 

변동요인 자유도 제곱합 평균제곱 F-통계량
처리효과 pq - 1 SSTR MSTR MSTR/MSE
처리 A p-1 SSA MSA MSA/MSE
처리 B q-1 SSB MSB MSB/MSE
 상호작용 (p-1)(q-1) SS(AB) MS(AB) MS(AB)/MSE
오차 pq(n-1) SSE MSE  
전체 N-1 TSS    

 

상호작용 효과가 유의하지 않으면 오차에 흡수시켜 다시분석합니다.
하지만, 상호작용 효과가 유의하면 주효과가 유의하지 않더라도 모형에 유지합니다.

 

(3) 가설 설정

 

전체적으로 모든 처리의 동일성을 검정할 때의 귀무가설입니다.

 

귀무가설 $H_0 :$ 모든 $\mu_{ij}$들이 같다.


상호작용효과의 유무를 확인하기 위한 귀무가설입니다.

 

상호작용 귀무가설 $H_{AB0} : (\alpha \beta)_{11} = (\alpha \beta)_{22} = ... = (\alpha \beta)_{pq} = 0$

 

 

요인 A와 요인 B의 처리효과 여부를 확인하기 위한 귀무가설 입니다.

 

요인 A 귀무가설 $H_{A0} : \alpha_1 = \alpha_2 = ,,, = \alpha_p = 0 $

요인 B 귀무가설 $H_{B0} : \beta_1 = \beta_2 = ,,, = \beta_q = 0 $

 

(4) 처리효과의 구간추정

 

$ \mu(A_i B_j) $의 구간추정 : $\bar{Y}_{ij+} \pm t_{\alpha/2 , pq(n-1)} \sqrt{MSE/n} $

 

$ \mu(A_i) $의 구간추정 : $\bar{Y}_{i++} \pm t_{\alpha/2 , pq(n-1)} \sqrt{MSE/nq} $

 

$ \mu(B_j) $의 구간추정 : $\bar{Y}_{+j+} \pm t_{\alpha/2 , pq(n-1)} \sqrt{MSE/np} $