일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 회귀분석
- 분산분석
- 통계학
- JavaScript
- 확률
- css
- 이항분포
- 데이터 과학
- 에세이
- 추정
- html
- 혼합효과모형
- 모평균에 대한 통계적추론
- 인공지능
- 반복있음
- 두 평균의 비교
- 이원배치 분산분석
- 가설검정
- 정규분포
- 글쓰기
- 티스토리챌린지
- 산점도
- 경제학
- 반복없음
- version 1
- 변량효과모형
- 고정효과모형
- r
- 변동분해
- 오블완
- Today
- Total
목록r (21)
생각 작업실 The atelier of thinking
Chapter 107. R을 이용한 회귀분석 예측값 구하기 데이터 과학에서의 통계학에서 통계프로그램의 역할은 점점 더 커지고 있습니다. 이제 더이상 계산기 조차 사용하지 않습니다. 특히 시간측면에서의 효율성에서 통계프로그램은 필수적 요소입니다. 통계학 공부를 할 때 이론과 더불어 실습을 함께 한다면 더욱 효과가 좋습니다. R은 통계학에서 가장 많이 사용하는 프로그램입니다. 이번 회차에는 앞서 살펴봤던 회귀분석 예측값을 R을 이용하여 구해보겠습니다. 1. 자료 불러오기 ◈ 예제 : 올림픽 100m 우승 기록 Andrew Tatem 등이 2004년 9월 Nature지에 발표한 논문에서 발췌한 것입니다. 1896~2004년까지의 남자와 여자의 육상 100m 우승 기록을 분석한 자료 입니다. 그 자료에 2..
Chapter 103. R을 이용한 회귀분석(Regression Analysis) 1. 자료 불러오기 ◈ 예제 : 올림픽 100미터 우승 기록 Andrew Tatem 등이 2004년 9월 Nature에 발표한 논문으로, 1896~2004년까지의 남자와 여자의 육상 100m 우승 기록을 분석한 자료입니다. 그 자료에 2016년까지 자료를 추가하였습니다. 연도우승기록연도우승기록연도우승기록남자여자남자여자남자여자189612 193610.311.519889.9210.54190011 194810.311.919929.9610.82190411 195210.411.519969.8410.94190810.8 195610.511.520009.8710.75191610.8 196010.211.020049.8510.93192010..
Chapter 100. R을 이용한 이원배치 분산분석 이번회차에는 R을 이용하여 반복이 있는 이원배치 분산분석을 정리해보고자 합니다. 1. 데이터 소개 ◈ 예제 : 배터리의 전압 차이 배터리의 최대 전압이 양극의 물질과 설치장소의 온도에 따라 차이가 있는지 알아보고자 합니다. battery Voltage Material Temperature1 130 1 502 155 1 503 74 1 504 180 1 505 34 1 656 40 1 657 80 1..
Chapter 92. R의 Dataset을 이용한 분산분석 이번회차에는 R에 내장되어 있는 데이터셋을 이용하여 일원배치 분산분석을 정리해보고자 합니다. R에는 다양한 예제 데이터셋이 내장되어 있어 데이터 분석 연습 및 예제로 활용할 수 있습니다. data() 내장되어 있는 데이터셋 리스트 1. Dataset 소개 chickwts는 R에 기본으로 포함된 데이터셋 중 하나입니다. 이 데이터셋은 71마리의 병아리에 대한 두 가지 다른 사료 조건에서 12일 동안의 체중을 기록한 것입니다. 데이터셋은 다음과 같이 구성되어 있습니다. (1) weight: 병아리의 체중(그램). (2) feed : 병아리에게 제공된 사료의 종류. "horsebean", "casein", "linseed", "soybean", "s..
Chapter 88. R을 이용한 분산분석(ANOVA) 1. 일원배치 분산분석 분산분석(ANOVA, Analysis of Variance)은 세 개 이상의 그룹 간의 평균차이를 비교 하는 통계적 기법입니다. 일원배치 분산분석(One-way ANOVA)은 한 개의 설명(독립)변수(요인)가 하나의 반응(종속)변수에 미치는 영향을 분석하는 통계 기법입니다. 일원배치 분산분석에서는 독립변수가 세 개 이상의 수준(그룹)을 가지며, 각 수준에서의 종속변수의 평균을 비교하여 그룹 간의 차이가 통계적으로 유의한지를 검정합니다. ◈ 예제 : 사료에 따른 체중증가 실험 이 실험에서 독립변수(요인)은 사료입니다. 그룹 혹은 수준(처리)의 수는 4 종류이고, 반응변수(종속변수)는 체증증가라고 할 수 있습니다. 실험 대상으로..
Chapter 79. R을 이용한 F 분포 및 등분산성 검정 1. R 에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다.분포별 확률질량(밀도)함수와 누적함수,분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quan..
Chapter 77. R을 이용한 두 그룹의 평균 비교 두 그룹의 평균을 비교할 때 사용할 수 있는 R의 함수는 t.test( )입니다. 앞서 단일 모집단의 모평균을 추론할 때에도 t.test( )를 사용했었습니다. ▶ t.test( )t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, conf.level = 0.95, var.equal = FALSE ...)x : 일표본 또는 이표본 데이터 셋이거나 차이가 평가되는 대응표본 데이터 셋y : 비교할 이표본 데이터 셋. 일표본 또는 대응표본 t-검정의 경우에는 NULL로 설정alternative: 검정의 양측성(..
Chapter 72. R을 이용한 모비율에 대한 통계적 추론 모비율에 대한 통계적 추론은 모집단에서 특정 범주형 변수의 비율을 추정하고 이에 대한 가설을 검정하는 것을 의미합니다. 이러한 추론은 주어진 표본을 사용하여 모비율에 대한 추정치를 계산하고, 이 추정치의 신뢰구간을 구하거나 가설을 검정하여 모비율이 특정 값과 같은지 여부를 판단합니다. 이번 회차에는 R을 이용한 모비율에 대한 통계적 추론에 대하여 알아보고자 합니다. 우선 R을 이용하여 모비율에 대한 구간 추정과 가설 검정에 대해 살펴보겠습니다. 1. 구간 추정 아래는 모비율의 중심축량입니다. $$ Z_0 = \frac{P-\theta_0}{\sqrt{\theta_0(1-\theta_0)/n}} \simeq N(0, 1) $$ 모비율의 통계적 ..
Chapter 69. R을 이용한 카이제곱분포 및 모분산 추정 1. R 에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다. 분포별 확률질량(밀도)함수와 누적함수, 분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이제곱분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q ..
Chapter 8. R을 이용한 모평균에 대한 통계적 추론 모평균에 대한 통계적 추론은 표본을 통해 모집단의 평균에 대한 정보를 얻고자 하는 과정입니다. 표본을 통하여 모집단의 평균을 추정하는 것을 말합니다. 이번 회차에는 R을 이용한 모평균에 대한 통계적 추론에 대하여 알아보고자 합니다. 우선 R을 이용하여 정규성 가정이 적절한지 여부를 확인한 후에 구간 추정과 가설 검정에 대해 살펴보겠습니다. 1. 정규성 가정 확인 정규성 가정은 모집단의 분포가 정규분포와 유사하게 분포하는 것을 가정하는 가설 검정의 매우 중요한 가정 중 하나이다. 만약 이 가정이 맞지 않으면, 가설 검정 결과에 대한 신뢰도가 떨어지거나 잘못된 결론을 내릴 가능성이 있습니다. 정규분포는 통계 분석에서 매우 중요한 역할을 한다. 특..