일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 산점도
- 분산분석
- 글쓰기
- 두 평균의 비교
- 확률
- version 2
- html
- 혼합효과모형
- 인공지능
- 통계학
- 추정
- css
- version 1
- 반복없음
- 회귀분석
- 에세이
- 변동분해
- 고정효과모형
- 티스토리챌린지
- 이원배치 분산분석
- JavaScript
- 반복있음
- r
- 오블완
- 이항분포
- 데이터 과학
- 경제학
- 가설검정
- 정규분포
- 변량효과모형
- Today
- Total
목록분류 전체보기 (197)
생각 작업실 The atelier of thinking
Chapter 78. 두 그룹간 분산 비교 - F 분포 두 그룹에 대한 통계적 추론을 수행할 때 정규성 검정과 등분산성 검정이 필요합니다. 정규성 검정(Normality Test)은 데이터가 정규분포를 따르는지 여부를 확인하는 것입니다. 많은 통계적 추정 및 가설 검정 방법은 데이터가 정규분포를 따를 때 최적의 성능을 보입니다. 또한, 중심극한정리에 따르면, 표본 평균의 분포는 표본 크기가 충분히 크면 정규분포에 근접하게 됩니다. 따라서 정규성 검정을 통해 데이터가 정규분포를 따르는지 확인하는 것은 통계적 추론의 타당성을 평가하는 데 도움이 됩니다. 등분산성 검정(Homogeneity of Variance Test) 은 두 그룹 간의 분산이 동일한지 여부를 확인하는 것입니다. 많은 통계적 분석 방법은 등..
Chapter 77. R을 이용한 두 그룹의 평균 비교 두 그룹의 평균을 비교할 때 사용할 수 있는 R의 함수는 t.test( )입니다. 앞서 단일 모집단의 모평균을 추론할 때에도 t.test( )를 사용했었습니다. ▶ t.test( )t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, conf.level = 0.95, var.equal = FALSE ...)x : 일표본 또는 이표본 데이터 셋이거나 차이가 평가되는 대응표본 데이터 셋y : 비교할 이표본 데이터 셋. 일표본 또는 대응표본 t-검정의 경우에는 NULL로 설정alternative: 검정의 양측성(..
Chapter 76. 두 그룹간 평균 비교 - 대응표본 독립표본과 대응표본으로 구분하는 이유는 통계적 실험의 설계와 분석 방법이 각각 다르기 때문입니다. 이 두 가지 유형의 실험은 각각 다른 상황에서 사용되며, 각각의 특성에 따라 적합한 분석 방법을 적용해야 합니다. 대응표본은 같은 개체 또는 짝을 이루는 개체로부터 얻은 두 개의 관측치를 사용하여 모집단 간의 차이를 검정하거나 비교하는 방법입니다. 두 개의 관측치는 개체 또는 짝을 이루는 개체로부터 얻어진 것이므로 관측치 간의 연관성이 있습니다. 대응표본은 시간의 차이, 동일한 개체의 전후 측정, 왼쪽과 오른쪽 등의 대응 관계를 가질 수 있습니다. 대응표본은 보통 같은 개체 또는 짝을 이루는 개체들에 대한 전후 차이, 처리 전후 차이 등을 검정하는 데 ..
Chapter 75. 두 그룹간 평균 비교 - 독립표본 II 정규성 검정과 등분산성 검정은 모수적 통계 분석의 전제 조건을 확인하는 데 중요한 도구입니다. 이러한 검정을 통해 추론 결과의 타당성을 평가하고, 적절한 통계 분석 방법을 선택할 수 있습니다. 정규성 가정 확인은 shapiro-wilk 검정 등으로 확인할 수 있습니다. 등분산성 검정이란 두 그룹 간의 분산이 동일한지 여부를 확인하는 것입니다. 많은 통계적 분석 방법은 등분산 가정을 전제로 합니다. 등분산성이 충족되지 않을 경우에는 분석 결과가 왜곡될 수 있습니다. 따라서 등분산성 검정을 통해 두 그룹 간의 분산이 유사한지 여부를 확인하는 것이 필요합니다. 이번 회차에서는 분산이 다른 경우에 대해 알아보겠습니다. 1. 모집단 가정 두 모집단..
Chapter 74. 두 그룹간 평균 비교 - 독립표본 I 통계 분석에서의 가정은 분석 결과의 정확성과 신뢰성을 보장하기 위해 중요합니다. 그러나 실제 데이터는 가정을 항상 충족시키지 않을 수 있습니다. 따라서 가정이 충족되지 않았을 때는 대안적인 분석 방법이나 접근 방식을 고려하여 데이터에 더 적합한 모델을 선택하고 분석의 정확성을 높일 필요가 있습니다. 가정이 충족되지 않았을 때 대안적인 분석 방법을 찾는 것은 중요합니다. 이를 통해 통계 분석 결과의 신뢰성을 높일 수 있으며, 더 나은 결론을 도출할 수 있습니다. 이를 통해 데이터에 대한 보다 정확한 이해를 얻을 수 있으며, 이는 의사결정에 더 나은 지원을 제공할 수 있습니다. 따라서 통계 분석을 수행할 때는 가정을 검토하고, 가정이 충족되지 않았을..
Chapter 73. 두 모집단의 비교 - 독립표본 & 대응표본 통계적 추론은 자료분석 및 결론을 내는 단계라고 할 수 있습니다. 통계적 추론은 목적에 따라 분류하면, 추정과 가설검정으로 나누어 볼 수 있습니다. 지금까지 단일 모집단의 모평균, 모분산, 모비율에 대한 통계적 추론, 즉 추정과 가설검정을 알아봤습니다. 이번 회차부터는 두 모집단의 비교에 대해 알아보고자 합니다. 구체적인 비교대상은 두 모집단의 평균, 분산, 그리고 비율입니다. 1. 두 모집단 비교의 의미 통계적 추론에서 두 모집단을 비교하는 것은 두 개 이상의 모집단 간에 특정 변수의 차이를 평가하고자 함을 의미합니다. 이는 두 모집단이 동일한 특성을 갖는지, 또는 어떤 차이가 있는지를 이해하고자 할 때 사용됩니다. 이러한 비교를 통..
Chapter 72. R을 이용한 모비율에 대한 통계적 추론 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. 이러한 추론은 주어진 표본을 사용하여 모비율에 대한 추정치를 계산하고, 이 추정치의 신뢰구간을 구하거나 가설을 검정하여 모비율이 특정 값과 같은지 여부를 판단합니다. 이번 회차에는 R을 이용한 모비율에 대한 통계적 추론에 대하여 알아보고자 합니다. 우선 R을 이용하여 모비율에 대한 구간 추정과 가설 검정에 대해 살펴보겠습니다. 1. 구간 추정 아래는 모비율의 중심축량입니다. $$ Z_0 = \frac{P-\theta_0}{\sqrt{\theta_0(1-\theta_0)/n}} \simeq N(0, 1) $$ 모비율의 통계적 ..
Chapter 71. 모비율에 대한 통계적 추론 II 정확한 모수 추정을 위해서는 전수 조사를 한다면 가장 정확하겠지만, 현실적으로 어려움이 많기 때문에 표본조사를 하게 됩니다. 하지만, 표본 수집이라 해도 많은 비용이 들기도 하고, 시간 등의 제약조건이 있습니다. 그렇다고 표본이 너무 적다면 신뢰도에 문제가 생길 수 있습니다. 즉, 표본크기는 모수 추정의 정확도 및 신뢰도에 영향을 줍니다. 따라서 모수 추정을 위한 표본크기는 정확도와 신뢰도, 비용과 시간을 고려한 최적의 크기를 정해야 합니다. 여기서 신뢰도는 신뢰수준을 통하여 , 정확도는 오차범위로 나타낼 수 있습니다. 통계학 추론의 두 방법인 구간추정과 가설검정에 기반한 표본크기 결정방법에 대하여 알아보겠습니다. 1. 구간 추정에 기반한 표본크기..
Chapter 70. 모비율에 대한 통계적 추론 통계적 추론은 추론 목적에 따라 크게 추정과 가설검정으로 나눌 수 있습니다. 통계적 추론은 일반적으로 모집단의 특성에 대한 정보를 표본으로부터 얻어내는 과정을 포함합니다. 특히, 모평균과 모분산은 통계적 추론에서 주로 다루어 지는 대상들 입니다. 이와 더불어 특정 범주형 변수의 비율을 추정 모비율 역시 통계적 추론에서 다루어집니다. 표본으로부터 얻은 통계량을 사용하여 모집단의 특성에 대한 가설을 검정하거나, 신뢰구간을 구하여 추정하는 등의 작업을 수행하여 통계적 추론을 실시합니다.1. 모비율에 대한 통계적 추론 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. 이러한 추론은 주어진 표본..
Chapter 69. R을 이용한 카이제곱분포 및 모분산 추정 1. R 에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다. 분포별 확률질량(밀도)함수와 누적함수, 분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이제곱분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q ..