일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- r
- 이원배치 분산분석
- 혼합효과모형
- 변동분해
- 변량효과모형
- 통계학
- 해운업
- 추정
- 정규분포
- JavaScript
- css
- 데이터 과학
- 반복있음
- html
- 확률
- 에세이
- 고정효과모형
- 이항분포
- 오블완
- 인공지능
- 경제학
- version 1
- 회귀분석
- 반복없음
- version 2
- 분산분석
- 티스토리챌린지
- 글쓰기
- 산점도
- 가설검정
- Today
- Total
생각 작업실 The atelier of thinking
96. 반복이 없는 이원배치 분산분석 III 본문
Chapter 96. 반복이 없는 이원배치 분산분석 III
이원배치 분산분석은 두 개의 설명(독립)변수(요인)가 있는 경우에 적용됩니다.
요인(설명변수,독립변수)이 두 개이고 각 처리(수준)에 하나의 관측값(반응변수,종속변수)이 있는 경우 각 요인의 처리효과를 확인하기 위한 모형을 설정합니다.
1. 혼합효과모형 ( Mixed Effect Model )
혼합효과모형이란 고정효과모형과 변량효과모형의 특성을 혼합한 모형입니다. 이 모형은 하나의 요인은 고정효과로 취급하고 다른 요인은 변량효과로 취급합니다.
(1) 모형식
이원배치 분산분석의 모형식은 아래와 같습니다.
$$ Y_{ij} = \mu + \alpha_i + \beta_j + \epsilon_{ij}$$
위 모형에서 요인 A는 고정효과모형을 요인B는 변량효과모형을 따른다고 했을 때, 모형식은 아래와 같이 나타낼 수 있습니다.
$$ Y_{ij} = \mu +( \mu_{i+} - \mu) + \beta_j + \epsilon_{ij}$$
위 모형식에서의 각 항에 대하여 아래와 같이 나타낼 수 있습니다.
$ \mu : $ 전체 평균
$ \epsilon_{ij} \sim iid N ( 0, \sigma^2) $
$ \mu_{i+} : $ 요인 A의 i 번째 수준평균
$ \beta_j \sim iid N ( 0, \sigma_B^2) $
이 때, $ \beta_j, \epsilon_{ij}$ 은 서로 독립입니다.
(2) 모형식의 특징
위 모형식에서 요인 A는 고정효과모형으로 상수로 나타나고, 요인 B는 확률변수이므로, 아래와 같은 성질을 가지게됩니다.
$$ E(Y_{ij}) = \mu $$
$$ Var(Y_{ij}) = \sigma_B^2 + \sigma^2$$
우선 기대값은 $\mu$이고 분산은 요인 A의 분산은 상수이므로 요인B의 분산만 더하게 됩니다.
공분산과 상관계수 역시 요인 B의 분산만 적용하면 아래와 같이 나타낼 수 있습니다.
또한 같은 요인내에서의 공분산은 아래와 같습니다.
$$ Cov(Y_{ij}, Y_{kj}) = \sigma_B^2 $$
요인 B의 상관관계는 아래와 같이 나타낼 수 있습니다.
$$ Cor(Y_{ij}, Y_{kj}) = \rho(B) = \frac{\sigma_B^2}{\sigma_B^2 + \sigma^2} $$
2. 혼합효과모형에서의 통계적 추론
(1) 혼합효과모형에서의 관심사항
혼합효과모형은 하나의 요인은 고정효과모형을 다른 하나의 요인은 변량효과모형을 사용합니다. 따라서 고정효과모형에서는 평균들의 차이, 변량효과모형에서는 분산이 0인지 아닌지가 관심사항이라 할 수 있습니다.
(2) 가설 설정
고정효과모형을 적용한 요인 A와 변량효과모형을 적용한 요안 B의 귀무가설은 아래와 같이 설정할 수 있습니다.
$$H_{A0} : \alpha_1 = \alpha_2 = ...=\alpha_p = 0 $$
$$H_{B0} : \sigma_B^2 = 0 $$
(3) 분산분석표
분산분석표에서 F 검정값을 확인하여 각각의 처리효과 유무를 판단하게 됩니다.
이 때, 유의하지 않는 요인의 처리효과가 있다면, 오차에 흡수시켜 다시 분석하게 됩니다.
변동요인 | 자유도 | 제곱합 | 평균제곱 | F-통계량 |
처리 A | p-1 | SSA | MSA | MSA/MSE |
처리 B | q-1 | SSB | MSB | MSB/MSE |
오차 | (p-1)(q-1) | SSE | MSE | |
전체 | N-1 | TSS |
(4) 모수 추정
위 분산분석표의 평균제곱은 아래와 같이 추정할 수 있습니다.
$$ E(MSE) = \sigma^2 $$
$$ E(MSA) = \sigma^2 + q\sum \alpha_i^2/(p-1) $$
$$ E(MSB) = \sigma^2 + p\sigma_B^2 $$
$\implies$ MSE보다 MSA(MSB)가 크다면 $\alpha_i \not= 0 (\sigma_B^2>0 )$ 일 가능성이 높아진다는 의미입니다.
요인 A의 평균들의 구간추정은 아래와 같습니다.
$\mu(A_i)$의 구간 추정 : $\bar{Y_i} \pm t_{\alpha/2(p-1)(q-1)} \sqrt{MSE/q}$
요인 B의 처리효과가 없는 경우에는 아래와 같습니다.
$$\bar{Y_i} \pm t_{\alpha/2(p-1)q)} \sqrt{MSE_A/q}$$
요인 B의 분산에 대한 추정은 아래와 같습니다.
$$\hat{\sigma}_B^2 = max \left(0, \frac{MSA-MSE}{p} \right)$$
요인 A의 처리효과가 없는 경우에는 아래와 같습니다.
$$ \hat{\sigma}_B^2 = \frac{MSA-MSE_B}{p}$$
요인 B의 상관계수는 아래와 같이 추정할 수 있습니다.
$$\hat{\rho}(B) = \frac{q(MSB - MSE)}{pMSA + qMSB +((p-1)(q-1)-1)MSE} $$
요인 A의 처리효과가 없을 때 상관계수는 아래와 같이 추정할 수 있습니다.
$$\hat{\rho}(B) = \frac{MSB}{MSB +(p-1)MSE_B} $$
혼합효과모형은 고정효과모형과 변량효과모형을 각각의 요인에 적용된 방법으로 혼합하여 사용하는 것이라 말할 수 있습니다.
'통계학 이야기' 카테고리의 다른 글
98. 반복이 있는 이원배치 분산분석 II (0) | 2024.07.18 |
---|---|
97. 반복이 있는 이원배치 분산분석 I (0) | 2024.07.17 |
95. 반복이 없는 이원배치 분산분석 II (1) | 2024.07.12 |
94. 반복이 없는 이원배치 분산분석 I (1) | 2024.07.10 |
93. 이원배치 분산분석(Two-Way ANOVA) (0) | 2024.07.09 |