일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터 과학
- 고정효과모형
- 반복없음
- version 1
- 이원배치 분산분석
- 해운업
- version 2
- 티스토리챌린지
- 정규분포
- 산점도
- JavaScript
- 회귀분석
- 확률
- 변동분해
- 변량효과모형
- 에세이
- 이항분포
- html
- 반복있음
- 경제학
- 글쓰기
- 통계학
- 인공지능
- 오블완
- 추정
- 가설검정
- r
- css
- 혼합효과모형
- 분산분석
- Today
- Total
생각 작업실 The atelier of thinking
95. 반복이 없는 이원배치 분산분석 II 본문
Chapter 95. 반복이 없는 이원배치 분산분석 II
1. 변량효과모형
앞서 일원배치 분산분석와 마찬가지로 변량효과모형은 각 처리 수준의 평균이 모집단에서 무작위로 추출된 것으로 간주합니다. 이 모형은 처리 수준이 랜덤으로 선택되는 경우에 사용됩니다. 변량효과모형은 처리 수준에 대한 일반화된 추론을 하기 위해 사용됩니다.

변량효과모형은 처리 효과가 랜덤으로 추출된 표본이며, 이러한 효과들이 모집단에서 랜덤하게 선택되었다고 가정하는 통계 모형입니다. 즉, 이 모형은 처리 효과를 무작위 효과로 간주하며, 각 처리 수준의 효과가 모집단에서 무작위로 추출되었다고 가정합니다.

고정효과모형이 두 요인의 수준 모두 실험자가 결정하였다면, 변량효과모형은 두 요인의 수준 모두 무작위로 선택되는 것이라 할 수 있습니다.
(1) 모형식
이원배치 분산분석의 모형식은 아래와 같습니다.
Yij=μ+αi+βj+ϵij
각 요인의 수준은 무작위로 추출되기 때문에 매번 바뀔 수 있습니다. 따라서,
수준의 평균들과 오차항은 확률변수로 표현할 수 있습니다.
αi,βj,ϵij⟹확률변수
각 항은 아래와 같습니다.
μ: 전체 평균
αi∼iidN(0.σ2A)
βj∼iidN(0,σ2B)
ϵij∼iidN(0,σ2)
이 때, αi,βj,ϵij 은 서로 독립입니다.
(2) 모형식의 특징
위 모형식은 확률변수이므로 아래와 같은 특징을 가지게 됩니다.
E(Yij)=μVar(Yij)=σ2A+σ2B+σ2
관측값에 대한 기대값과 분산은 위와 같이 나타납니다.
또한 같은 요인내에서의 공분산은 아래와 같습니다.
Cov(Yij,Yik)=σ2A
Cov(Yij,Ykj)=σ2B
(3) 동일 수준내에서의 관측값들 간의 상관관계
요인 A와 요인 B의 상관관계는 각각 아래와 같이 나타낼 수 있습니다.
Cor(Yij,Yik)=ρ(A)=σ2Aσ2A+σ2B+σ2
Cor(Yij,Ykj)=ρ(B)=σ2Bσ2A+σ2B+σ2
동일 수준내 상관계수(intraclass correlation coefficient : ICC)의 값이 크다는 것은 그룹 간의 변동이 크고, 그룹 내의 변동이 상대적으로 작다는 것을 의미합니다. 달리 표현하면, 전체 분산 중 수준 평균의 분산이 차지하는 비율이 높고, 동일 수준내의 두 관측값의 상관관계가 높다고 말할 수 있습니다.
2. 변량효과모형에서의 통계적 추론
(1) 변량효과모형에서의 관심문제
고정효과모형에서는 평균들의 차이 있는지에 대하여 검정을 하지만, 변량효과모형에서의 평균은 무작위 추출하는 확률변수이기 때문에 매번 바뀔 수 있기 때문에 평균들의 차이를 직접 구하는 것은 의미가 없습니다.
분산 σ2μ 이 0 이라면 평균은 차이가 없다는 의미이고, σ2μ>0 이라면 평균은 차이가 있다는 것입니다. 따라서, 변량효과모형에서의 관심은 분산 σ2μ 이라고 할 수 있습니다.
(2) 가설 설정
요인 A와 요인 B의 귀무가설은 아래와 같이 설정할 수 있습니다.
HA0:σ2A=0
HB0:σ2B=0
분산이 0이면 모든 값이 같다는 것입니다. 따라서 대립가설은 분산이 0이 아니면 처리효과가 있다는 것을 나타냅니다.
(3) 분산분석표
분산분석표에서 F 검정값을 확인하여 각각의 처리효과 유무를 판단하게 됩니다.
이 때, 유의하지 않는 요인의 처리효과가 있다면, 오차에 흡수시켜 다시 분석하게 됩니다.
변동요인 | 자유도 | 제곱합 | 평균제곱 | F-통계량 |
처리 A | p-1 | SSA | MSA | MSA/MSE |
처리 B | q-1 | SSB | MSB | MSB/MSE |
오차 | (p-1)(q-1) | SSE | MSE | |
전체 | N-1 | TSS |
(4) 모수 추정
위 분산분석표에서 평균제곱의 기대값은 아래 처럼 분산으로 표현할 수 있습니다.
E(MSE)=σ2
E(MSA)=σ2+qσ2A
E(MSB)=σ2+pσ2B
⟹ MSE보다 MSA(MSB)가 크다면 σ2A>0(σ2B>0) 일 가능성이 높아진다는 의미입니다.
이를 기반으로 각 요인의 분산을 추정해보면,
σ2A의 추정 : ^σ2A=max(0,MSA−MSEq)
⟹HB0 하에서 ^σ2A=MSA−MSEAq
σ2B의 추정 : ^σ2B=max(0,MSB−MSEp)
⟹HA0 하에서 ^σ2B=MSB−MSEBq
이 때 상관계수는 아래와 같이 추정해볼 수 있습니다.
ρ(A)의 추정 : ˆρ(A)=p(MSA−MSE)pMSA+qMSB+((p−1)(q−1)−1)MSE
⟹HB0 하에서 ˆρ(A)=MSAMSA+(q−1)MSEA
ρ(B)의 추정 : ˆρ(B)=q(MSB−MSE)pMSA+qMSB+((p−1)(q−1)−1)MSE
⟹HA0 하에서 ˆρ(B)=MSBMSB+(p−1)MSEB
'통계학 이야기' 카테고리의 다른 글
97. 반복이 있는 이원배치 분산분석 I (0) | 2024.07.17 |
---|---|
96. 반복이 없는 이원배치 분산분석 III (1) | 2024.07.16 |
94. 반복이 없는 이원배치 분산분석 I (1) | 2024.07.10 |
93. 이원배치 분산분석(Two-Way ANOVA) (0) | 2024.07.09 |
92. R의 Dataset을 이용한 분산분석 (0) | 2024.07.08 |