일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 통계학
- version 2
- JavaScript
- 정규분포
- 고정효과모형
- 변량효과모형
- r
- 회귀분석
- 혼합효과모형
- 변동분해
- 티스토리챌린지
- 이원배치 분산분석
- 인공지능
- 확률
- 이항분포
- 추정
- 에세이
- 가설검정
- 반복없음
- 경제학
- 산점도
- 두 평균의 비교
- css
- 반복있음
- 데이터 과학
- version 1
- 글쓰기
- 오블완
- html
- 분산분석
- Today
- Total
목록분류 전체보기 (197)
생각 작업실 The atelier of thinking
Chapter 88. R을 이용한 분산분석(ANOVA) 1. 일원배치 분산분석 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균차이를 비교 하는 통계적 기법입니다. 일원배치 분산분석(One-way ANOVA)은 한 개의 설명(독립)변수(요인)가 하나의 반응(종속)변수에 미치는 영향을 분석하는 통계 기법입니다. 일원배치 분산분석에서는 독립변수가 세 개 이상의 수준(그룹)을 가지며, 각 수준에서의 종속변수의 평균을 비교하여 그룹 간의 차이가 통계적으로 유의한지를 검정합니다. ◈ 예제 : 사료에 따른 체중증가 실험 이 실험에서 독립변수(요인)은 사료입니다. 그룹 혹은 수준(처리)의 수는 4 종류이고, 반응변수(종속변수)는 체증증가라고 할 수 있습니다. 실험 대상으로..
Chapter 87. 분산분석 - 변동분해 1. 변동분해(Decomposition of Variance) 분산분석(ANOVA)의 변동분해는 전체 변동을 다양한 요인 또는 처리로 분해하는 과정을 의미합니다. 이러한 변동분해를 통해 각 요인 또는 처리가 종속 변수에 미치는 영향을 평가하고 설명할 수 있습니다. 변동분해의 주요 목적과 사용 이유는 다음과 같습니다 (1) 요인 간 차이 비교 변동분해를 통해 각 요인이나 처리 간의 변동을 비교할 수 있습니다. 이를 통해 각 요인 또는 처리가 종속 변수에 미치는 영향의 정도를 파악할 수 있습니다. (2) 요인의 중요성 확인 변동분해를 통해 각 요인이나 처리가 전체 변동 중에서 어느 정도의 비율을 차지하는지 확인할 수 있습니다. 이를 통해 각 요인 또는 처리의 상대적..
Chapter 86. 일원배치 분산분석(One Way ANOVA) II 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균차이를 비교 하는 통계적 기법입니다. 분산분석은 반응변수(종속변수)의 수에 따라 단일변량 분산분석과 다변량 분산분석으로 분류할 수 있습니다. 다시 단일변량 분산분석은 설명변수(독립변수)의 수에 따라 일원배치 분산분석, 이원배치 분산분석 그리고 다원배치 분산분석으로 분류할 수 있습니다. 1. 변량효과모형(Random Effect Model) 변량효과모형은 각 처리 수준의 평균이 모집단에서 무작위로 추출된 것으로 간주합니다. 이 모형은 처리 수준이 랜덤으로 선택되는 경우에 사용됩니다. 변량효과모형은 처리 수준에 대한 일반화된 추론을 하기 위해 사용..
Chapter 85. 일원배치 분산분석(One-Way ANOVA) 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균차이를 비교 하는 통계적 기법입니다. 분산분석은 반응변수(종속변수)의 수에 따라 단일변량 분산분석과 다변량 분산분석으로 분류할 수 있습니다. 다시 단일변량 분산분석은 설명변수(독립변수)의 수에 따라 일원배치 분산분석, 이원배치 분산분석 그리고 다원배치 분산분석으로 분류할 수 있습니다. 이번 회차에서는 반응변수(종속변수)가 하나이고 설명변수(독립변수)가 하나인 일원배치 분산분석에 대해 알아보겠습니다. 1. 일원배치 분산분석 (One-way ANOVA) 일원배치 분산분석(One-way ANOVA)은 한 개의 설명(독립)변수(요인)가 하나의 반응(..
Chapter 84. 분산분석 통계모형(Model) 1. 통계모형 통계모형은 현상이나 데이터를 설명하거나 예측하기 위해 사용되는 수학적인 모델입니다. 일반적으로 통계모형은 변수 간의 관계를 나타내는 수학적인 표현이며, 이를 통해 데이터를 분석하고 해석할 수 있습니다. (1) 함수 공장 통계모형은 쉽게 표현하면 함수들의 공장이라고 할 수 있습니다. 함수는 입력값을 받아서 특정한 연산을 거쳐 출력값을 생성하는 규칙적인 과정을 정의합니다. 마찬가지로 통계모형도 입력 데이터를 받아서 이를 해석하고 설명하기 위한 특정한 구조를 정의합니다. 통계모형을 함수 공장으로 보고 통계분석과정을 비유하면, ① 함수 공장에는 원재료가 들어옵니다. 이것은 데이터의 입력이며, 통계모형에서는 변수들의 값이 됩니다. 이러..
Chapter 83. 분산분석의 검정통계량 앞서 두 그룹의 평균을 비교할 때는 T검정을 사용하였습니다. 하지만, 세 그룹이상의 평균을 비교할 때 T검정을 사용하게 되면 여러문제가 발생할 수 있습니다. 따라서, 세 그룹이상의 평균을 비교할 때는 분산분석을 사용하는 것이 좋습니다. 우선 알아볼 부분은 검정통계량입니다. 검정통계량은 통계적 추론에서 기준점을 제공합니다. 특히 가설 검정에 있어서 가설의 채택 여부를 결정하는 기준점입니다. 이번 회차에서는 분산분석의 검정통계량에 대해서 알아보겠습니다. 1. 다중검정의 문제 다중 검정의 문제란 여러 개의 가설을 동시에 검정할 때 발생할 수 있는 문제점들을 의미합니다. 세 그룹의 평균을 비교한다고 할 때, 두 그룹의 평균 차이를 비교했던 T 검정을 사용해서 비교..
Chapter 82. 분산분석(ANOVA) 이란 1. 분산분석 개요 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균 차이를 비교하는 통계적 기법입니다. 앞서 두 그룹의 평균 차이 비교는 T검정을 사용하여 추론하였으나 세 그룹 이상의 평균 차이 비교에는 분산분석을 사용합니다. 분산분석(ANOVA)은 영국의 통계학자인 Ronald A. Fisher에 의해 개발되었습니다. Fisher는 1918년에 제안된 분산분석 방법을 통해 여러 그룹 간의 평균 차이를 비교하는 효과적인 통계적 기법을 개발했습니다. Fisher의 분산분석은 그 후 통계학과 다양한 분야에서 널리 사용되어 왔습니다. 분산분석의 핵심 개념은 여러 그룹 간의 평균 차이를 검정하는 것이지만, 이 방법이..
Chapter 81. R을 이용한 두 그룹의 비율비교 두 그룹간 비율비교에 사용할 함수는 prop.test( ) 입니다. 단일 모집단의 모비율에 대한 통계적추론에서 사용했던 함수입니다. 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. ▶ prop.test( ) prop.test(x, n, p = NULL, alternative = "two.sided", conf.level = 0.95 , correct = TRUE)x : 성공한 횟수 (또는 벡터)n : 시도한 전체 횟수 (또는 벡터)p : 귀무가설에서의 비율 (옵션)alternative : 대립가설 종류 (default는 'two.sided'이며, 'less'와 'g..
Chapter 80. 두 그룹의 비율 비교 앞서 단일 모집단의 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. 이러한 추론은 주어진 표본을 사용하여 모비율에 대한 추정치를 계산하고, 이 추정치의 신뢰구간을 구하거나 가설을 검정하여 모비율이 특정 값과 같은지 여부를 판단합니다. 이번회차에는 두 개의 범주를 가진 데이터에서 각 범주의 비율을 추론하고, 두 그룹의 비율 차이를 검정해 보겠습니다.1. 모집단 가정 각각의 모집단은 동일한 두 범주로 (성공 S, 실패 F ) 로 나뉘어져 있다고 가정합니다. $\theta_1 : $ 모집단 X의 S 범주 비율, $\theta_2 : $ 모집단 Y의 S 범주 비율 여기에서 관심사항은 두 모비..
Chapter 79. R을 이용한 F 분포 및 등분산성 검정 1. R 에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다.분포별 확률질량(밀도)함수와 누적함수,분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quan..