일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 추정
- 혼합효과모형
- 티스토리챌린지
- 확률
- 데이터 과학
- 분산분석
- JavaScript
- 이항분포
- 두 평균의 비교
- 가설검정
- 경제학
- 글쓰기
- html
- 회귀분석
- 에세이
- r
- 통계학
- css
- 오블완
- 이원배치 분산분석
- 고정효과모형
- 변동분해
- 변량효과모형
- version 1
- 모평균에 대한 통계적추론
- 산점도
- 반복없음
- 인공지능
- 정규분포
- 반복있음
- Today
- Total
생각 작업실 The atelier of thinking
99. 반복이 있는 이원배치 분산분석 III 본문
Chapter 99. 반복이 있는 이원배치 분산분석 III
이원배치 분산분석은 두 개의 설명(독립)변수(요인)가 있는 경우에 적용됩니다. 이 요인들의 각 수준 조합에 대한 종속변수의 평균 차이를 비교합니다.
요인(설명변수,독립변수)이 두 개이고 각 처리(수준)에 하나의 관측값(반응변수,종속변수)이 있는 경우 각 요인의 처리 효과를 확인하기 위한 모형을 설정합니다.
반복이 있는 이원배치 분산분석의 모형식은 아래와 같습니다.
$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$
각 항은 아래와 같습니다.
$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $
$\alpha_i : $ 요인 A의 i 번째 처리효과
$\beta_j :$ 요인 B의 j 번째 처리효과(주효과)
$(\alpha \beta)_{ij} : $ 요인 A 와 B의 상호작용
1. 혼합 효과 모형
혼합효과모형은 고정효과모형과 변량효과모형의 특성을 혼합한 모형입니다. 이 모형은 하나의 요인은 고정효과로 취급하고 다른 요인은 변량효과로 취급합니다.
위 모형에서 요인 A는 고정효과모형을 요인 B는 변량효과모형을 따른다고 했을 때, 모형식은 아래와 같이 나타낼 수 있습니다.
$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha \beta)_{ij} + \epsilon_{ijk}$$
각 항에 대하여 아래와 같이 나타낼 수 있습니다.
$\mu :$ 전체평균
$\epsilon_{ijk} : $ 오차, $\epsilon_{ijk} \sim N(0, \sigma^2) $
$\alpha_i : $ 요인 A의 i 번째 처리효과(주효과) , $\sum \alpha_i = 0$
$\beta_j \sim iid N(0, \sigma_B^2)$ 요인 B의 j 번째 처리효과 , 확률변수
$(\alpha \beta)_{ij} \sim iid N(0, \sigma_{AB}^2 $ 요인 A 와 B의 상호작용
상호작용효과는 확률변수라 할 수 있습니다.
2. 혼합효과 모형식의 특징
위 모형식에서 요인 A는 고정효과모형으로 상수로 나타나고, 요인 B는 확률변수, 상호효과역시 확률변수이므로 아래와 같은 성질을 가지게 됩니다.
$$E(Y_{ijk}) = \mu $$
$$Var(Y_{ijk}) = \sigma_B^2 + \sigma_{AB}^2 + \sigma^2 $$
각 요인에서의 공분산은 아래와 같이 추론할 수 있습니다.
$$Cov(Y_{ijk}, Y_{ijk'}) = \sigma_B^2 + \sigma_{AB}^2 $$
$$Cov(Y_{ijk}, Y_{i'jk'}) = \sigma_B^2 - \sigma_{AB}^2/(p-1) $$
$$Cov(Y_{ijk}, Y_{i'j'k'}) = 0 $$
3. 평균제곱(MS)의 기대값
$E(MSE) = \sigma^2$
$E(MS(AB)) = \sigma^2 + np\sigma_{AB}^2/(p-1)$
$\implies MSE$에 비해 $MS(AB)$가 크면 클수록 $\sigma_{AB}^2 > 0$일 가능성이 높습니다.
$E(MSA) = \sigma^2 + n\sigma_{AB}^2/(p-1) + nq\sum_{i=1}^p \alpha_i^2/(p-1)$
$E(MSB) = \sigma^2 + np\sigma_B^2$
$\implies MSE$와 $MSA$ 또는 $MSB$ 를 직접 비교하기는 곤란합니다.
$\implies MS(AB)$에 비해 $MSA$가 크면 클수록 $\alpha_i^2 \not= 0$일 가능성이 높습니다.
$\implies MS(AB)$에 비해 $MSB$가 크면 클수록 $\sigma_B^2>0$일 가능성이 높습니다.
4. 혼합 효과 모형 분산분석표
요인 A의 처리효과를 확인하기 위한 F-통계량은 MSE 대신에 MS(AB)를 사용하고, 요인 B의 처리효과를 확인하기 위한 F-통계량은 그대로 MSE를 사용합니다.
변동요인 | 자유도 | 제곱합 | 평균제곱 | F-통계량 |
처리 A(고정) | p-1 | SSA | MSA | MSA/MS(AB) |
처리 B(변량) | q-1 | SSB | MSB | MSB/MSE |
상호작용 | (p-1)(q-1) | SS(AB) | MS(AB) | MS(AB)/MSE |
오차 | pq(n-1) | SSE | MSE | |
전체 | N-1 | TSS |
상호작용효과가 유의하지 않으면 오차에 흡수시켜 다시 분석합니다.
상호작용효과가 유의하면 주효과가 유의하지 않더라도 모형을 유지합니다.
5. 모수 추정
(1) 상호 작용 효과의 분산
$$E(MSE) = \sigma^2$$
$$E(MS(AB)) = \sigma^2 + np\sigma_{AB}^2/(p-1) $$
$$\implies np\sigma_{AB}^2/(p-1)= E(MS(AB)) - E(MSE) $$
$$\sigma_{AB}^2 = \frac{(p-1)}{np} (E(MS(AB)) - E(MSE)) $$
(2) 요인 A의 처리효과 구간추정
고정효과모형에서의 모수는 평균의 차이입니다.
$\mu(A_i)$의 구간 추정은 아래와 같이 할 수 있습니다.
$$ \bar{Y}_{i++} \pm t_{\alpha/2 , (p-1)(q-1)} \sqrt{MS(AB)/nq} $$
(3) 요인 B의 처리효과 분산추정
변량효과모형에서의 모수는 분산입니다.
$$E(MSB) = \sigma^2 + np\sigma_B^2$$
$$\implies np\sigma_B^2 = E(MSB) - E(MS(AB))$$
$$\sigma_B^2 = \frac{E(MSB) - E(MS(AB))}{np}$$
'통계학 이야기' 카테고리의 다른 글
101. 회귀분석(Regression Analysis)이란 (1) | 2024.07.25 |
---|---|
100. R을 이용한 이원배치 분산분석 (2) | 2024.07.24 |
98. 반복이 있는 이원배치 분산분석 II (0) | 2024.07.18 |
97. 반복이 있는 이원배치 분산분석 I (0) | 2024.07.17 |
96. 반복이 없는 이원배치 분산분석 III (1) | 2024.07.16 |