일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 오블완
- 변량효과모형
- html
- 가설검정
- 경제학
- 글쓰기
- 혼합효과모형
- 분산분석
- 산점도
- 확률
- 해운업
- version 2
- 변동분해
- 에세이
- 추정
- 반복없음
- version 1
- 이원배치 분산분석
- css
- 정규분포
- JavaScript
- 고정효과모형
- 회귀분석
- 이항분포
- 반복있음
- r
- 통계학
- 데이터 과학
- 인공지능
- 티스토리챌린지
- Today
- Total
생각 작업실 The atelier of thinking
62. 추정(Estimation) - 구간 추정(Interval Estimation) 본문
Chapter 62. 추정(Estimation) - 구간 추정(Interval Estimation)
통계적 추론은 추론 목적에 따라 크게 추정과 가설검정으로 나눌 수 있습니다.
추정은 표본을 통해 모집단의 모수를 추측하는 것을 의미합니다.
추정은 표본의 정보를 활용하여 모집단에 대한 정보를 얻는 데에 중요한 역할을 합니다.
추정은 점추정과 구간추정으로 나눌 수 있습니다.
구간 추정은 표본에서 계산한 통계량을 이용하여 모수가 속할 가능성이 높은 구간을 추정하는 방법입니다.
1. 구간 추정(Interval Estimation)
구간추정은 표본에서 계산한 통계량(예: 표본평균)을 이용하여 모수(예: 모평균)가 속할 가능성이 높은 구간을 추정하는 방법입니다. 일반적으로, 구간추정은 표본으로부터 계산된 점추정치(예: 표본평균)와 구간추정의 신뢰도를 나타내는 신뢰수준(예: 95%)을 이용하여 구간을 추정합니다. 미지의 모수가 포함될 것으로 기대하는 범위를 확률적으로 택하는 과정이라 할 수 있습니다.
2. 신뢰구간(Confidence Interval, CI)
신뢰구간이란 통계적 추정에서 모수의 추정치가 존재할 것으로 예상되는 구간을 나타냅니다.
예를 들어, 모평균 $\mu$ 에 대한 95% 신뢰구간을 구한다고 했을 때,
모집단이 평균이 $\mu$ 이고 분산이 $\sigma^2$ 인 정규분포이고, 이 때 $\sigma^2$을 알고 있다고 가정하고 표본추출을 한다면,
$$ X_1,X_2,...,X_n \overset{\mathrm{iid}}{\sim} N(\mu , \sigma^2) $$
이 때 점추정량 $\mu$는 직관적인 점추정량을 $\bar{X}$ 를 사용할 수 있습니다.
$\bar{X}$의 통계적 성질은 아래와 같습니다.
$$ \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) $$
이를 표준화 하면, 아래와 같습니다.
$$ Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) $$
이 때 $Z$ 는 모수와 통계량으로 이루어져 있고, 분포에는 미지모수를 포함하고 있지 않습니다.
이제 표준정규분포부터 $\mu$에 대한 95% 신뢰구간을 아래와 같이 구할 수 있습니다.
$$ 0.95 = P( -1.96 < Z < 1.96 ) = P( -1.96< \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} < 1.96 ) $$
$$ = P( \bar{X} -1.96 \sigma/\sqrt{n} < \mu < \bar{X} + 1.96 \sigma/\sqrt{n}) $$
따라서, $\mu$에 대한 95% 신뢰구간은 아래와 같이 표현합니다.
$$ ( \bar{X} -1.96 \sigma/\sqrt{n}, \bar{X} + 1.96 \sigma/\sqrt{n}) $$
3. 신뢰수준(Confidence Level)
신뢰수준은 신뢰구간에서 사용되는 통계적 지표로, 표본에서 얻은 결과가 실제로 모집단에서 발생한 것이라고 생각하는 정도를 나타냅니다.
일반적으로 95%,99% 등이 사용되며, 이는 "우리가 이 구간 안에 실제 모수가 있을 것으로 믿을 정도"를 나타냅니다. 95% 신뢰수준의 경우, 여러 번 표본을 추출하면 95%의 경우에 신뢰구간이 모평균을 포함할 것으로 기대된다는 것입니다.
위 그림에서 빨간색은 신뢰구간이 모평균을 포함하고 있지 않은 것을 나타냅니다.
95% 신뢰수준이란 위 그림에서 신뢰구간이 모평균을 포함할 것으로 100번의 실험에서 95번 예상한다는 것입니다.
간단히 말하면, 신뢰수준은 우리가 얼마나 확신하는 지에 대한 정도를 나타내며, 신뢰구간은 그 확신의 범위를 나타냅니다.
'통계학 이야기' 카테고리의 다른 글
64. 모평균에 대한 통계적 추론 I (1) | 2024.01.16 |
---|---|
63. 가설 검정(Hypothesis Testing) (0) | 2024.01.04 |
61. 추정(Estimation) - 점 추정(Point Estimation) (0) | 2023.12.25 |
60. 통계적 추론(추론 통계학)의 개요 (2) | 2023.12.22 |
59. 카이제곱분포(Chi-square Distribution) - 연속확률분포 (0) | 2023.12.20 |