일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 혼합효과모형
- 두 평균의 비교
- 변동분해
- r
- 분산분석
- 글쓰기
- 이항분포
- 데이터 과학
- 변량효과모형
- 산점도
- 경제학
- 오블완
- 인공지능
- 확률
- version 2
- html
- version 1
- 통계학
- css
- 티스토리챌린지
- JavaScript
- 정규분포
- 회귀분석
- 에세이
- 이원배치 분산분석
- 반복없음
- 고정효과모형
- 반복있음
- 가설검정
- 추정
- Today
- Total
목록통계학 이야기 (109)
생각 작업실 The atelier of thinking
Chapter 87. 분산분석 - 변동분해 1. 변동분해(Decomposition of Variance) 분산분석(ANOVA)의 변동분해는 전체 변동을 다양한 요인 또는 처리로 분해하는 과정을 의미합니다. 이러한 변동분해를 통해 각 요인 또는 처리가 종속 변수에 미치는 영향을 평가하고 설명할 수 있습니다. 변동분해의 주요 목적과 사용 이유는 다음과 같습니다 (1) 요인 간 차이 비교 변동분해를 통해 각 요인이나 처리 간의 변동을 비교할 수 있습니다. 이를 통해 각 요인 또는 처리가 종속 변수에 미치는 영향의 정도를 파악할 수 있습니다. (2) 요인의 중요성 확인 변동분해를 통해 각 요인이나 처리가 전체 변동 중에서 어느 정도의 비율을 차지하는지 확인할 수 있습니다. 이를 통해 각 요인 또는 처리의 상대적..
Chapter 85. 일원배치 분산분석(One-Way ANOVA) 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균차이를 비교 하는 통계적 기법입니다. 분산분석은 반응변수(종속변수)의 수에 따라 단일변량 분산분석과 다변량 분산분석으로 분류할 수 있습니다. 다시 단일변량 분산분석은 설명변수(독립변수)의 수에 따라 일원배치 분산분석, 이원배치 분산분석 그리고 다원배치 분산분석으로 분류할 수 있습니다. 이번 회차에서는 반응변수(종속변수)가 하나이고 설명변수(독립변수)가 하나인 일원배치 분산분석에 대해 알아보겠습니다. 1. 일원배치 분산분석 (One-way ANOVA) 일원배치 분산분석(One-way ANOVA)은 한 개의 설명(독립)변수(요인)가 하나의 반응(..
Chapter 84. 분산분석 통계모형(Model) 1. 통계모형 통계모형은 현상이나 데이터를 설명하거나 예측하기 위해 사용되는 수학적인 모델입니다. 일반적으로 통계모형은 변수 간의 관계를 나타내는 수학적인 표현이며, 이를 통해 데이터를 분석하고 해석할 수 있습니다. (1) 함수 공장 통계모형은 쉽게 표현하면 함수들의 공장이라고 할 수 있습니다. 함수는 입력값을 받아서 특정한 연산을 거쳐 출력값을 생성하는 규칙적인 과정을 정의합니다. 마찬가지로 통계모형도 입력 데이터를 받아서 이를 해석하고 설명하기 위한 특정한 구조를 정의합니다. 통계모형을 함수 공장으로 보고 통계분석과정을 비유하면, ① 함수 공장에는 원재료가 들어옵니다. 이것은 데이터의 입력이며, 통계모형에서는 변수들의 값이 됩니다. 이러..
Chapter 83. 분산분석의 검정통계량 앞서 두 그룹의 평균을 비교할 때는 T검정을 사용하였습니다. 하지만, 세 그룹이상의 평균을 비교할 때 T검정을 사용하게 되면 여러문제가 발생할 수 있습니다. 따라서, 세 그룹이상의 평균을 비교할 때는 분산분석을 사용하는 것이 좋습니다. 우선 알아볼 부분은 검정통계량입니다. 검정통계량은 통계적 추론에서 기준점을 제공합니다. 특히 가설 검정에 있어서 가설의 채택 여부를 결정하는 기준점입니다. 이번 회차에서는 분산분석의 검정통계량에 대해서 알아보겠습니다. 1. 다중검정의 문제 다중 검정의 문제란 여러 개의 가설을 동시에 검정할 때 발생할 수 있는 문제점들을 의미합니다. 세 그룹의 평균을 비교한다고 할 때, 두 그룹의 평균 차이를 비교했던 T 검정을 사용해서 비교..
Chapter 82. 분산분석(ANOVA) 이란 1. 분산분석 개요 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균 차이를 비교하는 통계적 기법입니다. 앞서 두 그룹의 평균 차이 비교는 T검정을 사용하여 추론하였으나 세 그룹 이상의 평균 차이 비교에는 분산분석을 사용합니다. 분산분석(ANOVA)은 영국의 통계학자인 Ronald A. Fisher에 의해 개발되었습니다. Fisher는 1918년에 제안된 분산분석 방법을 통해 여러 그룹 간의 평균 차이를 비교하는 효과적인 통계적 기법을 개발했습니다. Fisher의 분산분석은 그 후 통계학과 다양한 분야에서 널리 사용되어 왔습니다. 분산분석의 핵심 개념은 여러 그룹 간의 평균 차이를 검정하는 것이지만, 이 방법이..
Chapter 81. R을 이용한 두 그룹의 비율비교 두 그룹간 비율비교에 사용할 함수는 prop.test( ) 입니다. 단일 모집단의 모비율에 대한 통계적추론에서 사용했던 함수입니다. 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. ▶ prop.test( ) prop.test(x, n, p = NULL, alternative = "two.sided", conf.level = 0.95 , correct = TRUE)x : 성공한 횟수 (또는 벡터)n : 시도한 전체 횟수 (또는 벡터)p : 귀무가설에서의 비율 (옵션)alternative : 대립가설 종류 (default는 'two.sided'이며, 'less'와 'g..
Chapter 80. 두 그룹의 비율 비교 앞서 단일 모집단의 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. 이러한 추론은 주어진 표본을 사용하여 모비율에 대한 추정치를 계산하고, 이 추정치의 신뢰구간을 구하거나 가설을 검정하여 모비율이 특정 값과 같은지 여부를 판단합니다. 이번회차에는 두 개의 범주를 가진 데이터에서 각 범주의 비율을 추론하고, 두 그룹의 비율 차이를 검정해 보겠습니다.1. 모집단 가정 각각의 모집단은 동일한 두 범주로 (성공 S, 실패 F ) 로 나뉘어져 있다고 가정합니다. $\theta_1 : $ 모집단 X의 S 범주 비율, $\theta_2 : $ 모집단 Y의 S 범주 비율 여기에서 관심사항은 두 모비..
Chapter 79. R을 이용한 F 분포 및 등분산성 검정 1. R 에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다.분포별 확률질량(밀도)함수와 누적함수,분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quan..
Chapter 78. 두 그룹간 분산 비교 - F 분포 두 그룹에 대한 통계적 추론을 수행할 때 정규성 검정과 등분산성 검정이 필요합니다. 정규성 검정(Normality Test)은 데이터가 정규분포를 따르는지 여부를 확인하는 것입니다. 많은 통계적 추정 및 가설 검정 방법은 데이터가 정규분포를 따를 때 최적의 성능을 보입니다. 또한, 중심극한정리에 따르면, 표본 평균의 분포는 표본 크기가 충분히 크면 정규분포에 근접하게 됩니다. 따라서 정규성 검정을 통해 데이터가 정규분포를 따르는지 확인하는 것은 통계적 추론의 타당성을 평가하는 데 도움이 됩니다. 등분산성 검정(Homogeneity of Variance Test) 은 두 그룹 간의 분산이 동일한지 여부를 확인하는 것입니다. 많은 통계적 분석 방법은 등..
Chapter 77. R을 이용한 두 그룹의 평균 비교 두 그룹의 평균을 비교할 때 사용할 수 있는 R의 함수는 t.test( )입니다. 앞서 단일 모집단의 모평균을 추론할 때에도 t.test( )를 사용했었습니다. ▶ t.test( )t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, conf.level = 0.95, var.equal = FALSE ...)x : 일표본 또는 이표본 데이터 셋이거나 차이가 평가되는 대응표본 데이터 셋y : 비교할 이표본 데이터 셋. 일표본 또는 대응표본 t-검정의 경우에는 NULL로 설정alternative: 검정의 양측성(..