일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 변동분해
- 변량효과모형
- 반복있음
- 회귀분석
- r
- 이원배치 분산분석
- 글쓰기
- JavaScript
- css
- 경제학
- 추정
- 정규분포
- 데이터 과학
- 산점도
- 반복없음
- 티스토리챌린지
- 두 평균의 비교
- version 1
- 에세이
- 가설검정
- 오블완
- 모평균에 대한 통계적추론
- 통계학
- 인공지능
- 이항분포
- 혼합효과모형
- 고정효과모형
- html
- 분산분석
- 확률
- Today
- Total
생각 작업실 The atelier of thinking
97. 반복이 있는 이원배치 분산분석 I 본문
Chapter 97. 반복이 있는 이원배치 분산분석 I
이원배치 분산분석은 두 개의 설명(독립)변수(요인)가 있는 경우에 적용됩니다. 이 요인들의 각 수준 조합에 대한 종속변수의 평균 차이를 비교합니다.
요인(설명변수,독립변수)이 두 개이고 각 처리(수준)에 하나의 관측값(반응변수,종속변수)이 있는 경우 각 요인의 처리 효과를 확인하기 위한 모형을 설정합니다.
1. 자료구조
반복이 있는 경우의 자료구조는 아래와 같습니다.
요인 1 | 요인 2 | |||
1 | 2 | ... | q | |
1 | $Y_{111}$ $Y_{112}$ ... $Y_{11n}$ |
$Y_{121}$ $Y_{122}$ ... $Y_{12n}$ |
... | $Y_{1q1}$ $Y_{1q2}$ ... $Y_{1qn}$ |
2 | $Y_{211}$ $Y_{212}$ ... $Y_{21n}$ |
$Y_{221}$ $Y_{222}$ ... $Y_{22n}$ |
... | $Y_{2q1}$ $Y_{2q2}$ ... $Y_{2qn}$ |
... | ... | ... | ... | ... |
p | $Y_{p11}$ $Y_{p12}$ ... $Y_{p1n}$ |
$Y_{p21}$ $Y_{p22}$ ... $Y_{p2n}$ |
... | $Y_{pq1}$ $Y_{pq2}$ ... $Y_{pqn}$ |
2. 모형식
이원배치 분산분석에서 반복이 없는 경우, 각 요인이 두 개이고 각 처리에 반복하여 관측값이 있는 경우, 모형은 다음과 같이 설정됩니다.
$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$
각 항은 아래와 같습니다.
$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $
$\alpha_i : $ 요인 A의 i 번째 처리효과
$\beta_j :$ 요인 B의 j 번째 처리효과(주효과)
$(\alpha \beta)_{ij} : $ 요인 A 와 B의 상호작용
반복이 없는 이원배치 분산분석의 모형식과 다른 점은 상호작용이 발생한다는 것입니다.
3. 상호작용
상호작용효과란 한 요인의 효과가 다른 요인의 수준에 따라 달라지는 경우를 의미합니다. 즉, 두 요인 간의 상호작용이 존재할 때 각 요인의 효과가 서로 영향을 주고받는 것을 나타냅니다.
상호작용이 없는 경우를 상호작용도표으로 나타내면,
(1) 요인 A, 요인 B 모두 효과가 없을때
각 요인내 수준의 평균이 비슷하게 나타납니다.
(2) 요인 A 처리효과 없고, 요인 B 처리효과 있을 때
요인A의 수준들의 평균은 차이가 없지만 요인 B의 수준들의 평균은 차이가 있습니다.
(3) 요인 A 처리효과 있고, 요인 B 처리효과 없을 때
요인A의 수준들의 평균은 차이가 있지만 요인 B의 수준들의 평균은 차이가 없습니다.
(4) 요인 A와 요인 B 모두 처리효과가 있을때
요인 A와 요인 B의 수준들의 평균의 차이가 나타납니다.
위의 4 가지 경우는 모두 평균의 차이로 처리효과 여부를 알 수 있습니다. 하지만, 아래의 경우는 평균의 차이로 처리효과를 알 수 없습니다.
(5) 평균의 차이로 처리효과 여부를 알 수 없을 때
위 경우는 평균의 차이로만으로는 처리효과 여부를 알 수 없습니다. 이를 보완하기 위해 추가하는 것이 상호작용입니다.
상호작용이 있는 경우, 두 요인의 효과를 독립적으로 분석하는 것만으로는 실험의 결과를 올바르게 해석할 수 없습니다. 상호작용이 없는 경우에만 각 요인의 효과를 독립적으로 분석할 수 있습니다. 상호작용을 고려하지 않으면 실험 결과의 해석이 오용될 수 있으며, 상호작용이 없다고 가정한 모델이 데이터와 일치하지 않을 수 있습니다.
따라서 이원배치 분산분석을 수행할 때는 상호작용 효과를 고려하여 모델링하는 것이 중요합니다. 상호작용이 있는 경우에는 적절한 모델링을 통해 상호작용 효과를 포착하고 실험 결과를 정확하게 해석할 수 있습니다.
4. 고정효과모형
$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$
위 반복이 있는 이원배치 분산분석 모형식을 고정효과모형에서는 아래와 같이 나타낼 수 있습니다.
$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$
$$ = \mu + (\mu_{i+}-\mu) + (\mu_{+j}-\mu) + (\mu_{ij}-\mu_{i+}-\mu_{+j}+\mu) + \epsilon_{ijk}$$
(1) 변동분해
위 모형식을 변동분해하면 아래와 같이 나타낼 수 있습니다.
$$Y_{ijk} - \mu = (\mu_{i+}-\mu) + (\mu_{+j}-\mu) + (\mu_{ij}-\mu_{i+}-\mu_{+j}+\mu) + \epsilon_{ijk}$$
$\mu$ 대신 추정치$(Y)$를 사용하여 나타내면,
$$Y_{ijk} - \bar{Y} = (\bar{Y}_{i++}-\bar{Y}) + (\bar{Y}_{+j+}-\bar{Y}) + (\bar{Y}_{ij+}-\bar{Y}_{i++}-\bar{Y}_{+j+}+\bar{Y}) + Y_{ijk} - \bar{Y}_{ij+}$$
위 식을 제곱합으로 각 항을 분리해보면 아래와 같습니다.
$ TSS : \sum_{i=1}^p \sum_{j=1}^q \sum_{k=1}^n (Y_{ijk}+\bar{Y})^2$, 자유도는 $N-1$
$ SSA : nq \sum_{i=1}^p (\bar{Y}_{i++} - \bar{Y})^2$, 자유도는 $p-1$
$ SSB : np \sum_{j=1}^q (\bar{Y}_{+j+} - \bar{Y})^2$, 자유도는 $q-1$
$ SS(AB) : n \sum_{i=1}^p \sum_{j=1}^q (\bar{Y}_{ij} - \bar{Y}_{i++} - \bar{Y}_{+j+} +\bar{Y})^2$, 자유도는 $(p-1)(q-1)$
$ SSE : \sum_{i=1}^p \sum_{j=1}^q \sum_{k=1}^n (Y_{ijk} - \bar{Y}_{ij+})^2$, 자유도는 $pq(n-1)$
처리효과만 따로 나타낸다면,
$ SSTR : n \sum_{i=1}^p \sum_{j=1}^q (\bar{Y}_{ij+} - \bar{Y})^2$, 자유도는 $pq-1$
$ SSTR = SSA + SSB + SS(AB)$
$ TSS = SSTR + SSE $
(2) 분산분석표
위 변동분해를 분산분석표로 나타내면 아래와 같습니다.
변동요인 | 자유도 | 제곱합 | 평균제곱 | F-통계량 |
처리효과 | pq - 1 | SSTR | MSTR | MSTR/MSE |
처리 A | p-1 | SSA | MSA | MSA/MSE |
처리 B | q-1 | SSB | MSB | MSB/MSE |
상호작용 | (p-1)(q-1) | SS(AB) | MS(AB) | MS(AB)/MSE |
오차 | pq(n-1) | SSE | MSE | |
전체 | N-1 | TSS |
상호작용 효과가 유의하지 않으면 오차에 흡수시켜 다시분석합니다.
하지만, 상호작용 효과가 유의하면 주효과가 유의하지 않더라도 모형에 유지합니다.
(3) 가설 설정
전체적으로 모든 처리의 동일성을 검정할 때의 귀무가설입니다.
귀무가설 $H_0 :$ 모든 $\mu_{ij}$들이 같다.
상호작용효과의 유무를 확인하기 위한 귀무가설입니다.
상호작용 귀무가설 $H_{AB0} : (\alpha \beta)_{11} = (\alpha \beta)_{22} = ... = (\alpha \beta)_{pq} = 0$
요인 A와 요인 B의 처리효과 여부를 확인하기 위한 귀무가설 입니다.
요인 A 귀무가설 $H_{A0} : \alpha_1 = \alpha_2 = ,,, = \alpha_p = 0 $
요인 B 귀무가설 $H_{B0} : \beta_1 = \beta_2 = ,,, = \beta_q = 0 $
(4) 처리효과의 구간추정
$ \mu(A_i B_j) $의 구간추정 : $\bar{Y}_{ij+} \pm t_{\alpha/2 , pq(n-1)} \sqrt{MSE/n} $
$ \mu(A_i) $의 구간추정 : $\bar{Y}_{i++} \pm t_{\alpha/2 , pq(n-1)} \sqrt{MSE/nq} $
$ \mu(B_j) $의 구간추정 : $\bar{Y}_{+j+} \pm t_{\alpha/2 , pq(n-1)} \sqrt{MSE/np} $
'통계학 이야기' 카테고리의 다른 글
99. 반복이 있는 이원배치 분산분석 III (0) | 2024.07.22 |
---|---|
98. 반복이 있는 이원배치 분산분석 II (0) | 2024.07.18 |
96. 반복이 없는 이원배치 분산분석 III (1) | 2024.07.16 |
95. 반복이 없는 이원배치 분산분석 II (1) | 2024.07.12 |
94. 반복이 없는 이원배치 분산분석 I (1) | 2024.07.10 |