일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- html
- 분산분석
- 추정
- 반복없음
- 두 평균의 비교
- 반복있음
- 에세이
- 경제학
- css
- version 2
- 확률
- 고정효과모형
- 변량효과모형
- 산점도
- 글쓰기
- 회귀분석
- 티스토리챌린지
- 오블완
- version 1
- 통계학
- 인공지능
- r
- 데이터 과학
- 이원배치 분산분석
- 변동분해
- 이항분포
- JavaScript
- 혼합효과모형
- 가설검정
- 정규분포
- Today
- Total
목록관측값 (2)
생각 작업실 The atelier of thinking
Chapter 107. R을 이용한 회귀분석 예측값 구하기 데이터 과학에서의 통계학에서 통계프로그램의 역할은 점점 더 커지고 있습니다. 이제 더이상 계산기 조차 사용하지 않습니다. 특히 시간측면에서의 효율성에서 통계프로그램은 필수적 요소입니다. 통계학 공부를 할 때 이론과 더불어 실습을 함께 한다면 더욱 효과가 좋습니다. R은 통계학에서 가장 많이 사용하는 프로그램입니다. 이번 회차에는 앞서 살펴봤던 회귀분석 예측값을 R을 이용하여 구해보겠습니다. 1. 자료 불러오기 ◈ 예제 : 올림픽 100m 우승 기록 Andrew Tatem 등이 2004년 9월 Nature지에 발표한 논문에서 발췌한 것입니다. 1896~2004년까지의 남자와 여자의 육상 100m 우승 기록을 분석한 자료 입니다. 그 자료에 2..
Chapter 106. 회귀분석 - 예측값과 관측값 1. 예측값과 관측값 회귀분석에서 예측값이란 회귀분석 모델이 분석해서 예측한 값을 말합니다. 관측값은 실제 데이터에서 직접 수집하거나 측정한 값입니다. 그리고 예측값과 관측값의 차이를 잔차라고 한다. 이 잔차가 작을 수록 회귀분석 모델의 성능이 좋다고 말할 수 있다. 회귀분석의 목적은 예측값과 관측값의 차이를 최소화하는 모델을 만드는 것이다. 단순선형 회귀모형은 아래와 같습니다. $$Y_i = \beta_0 + \beta_1x_i + \epsilon_i$$$$ \epsilon_i \sim iid N(0,\sigma^2)$$ 위 모형을 그림으로 나타내면, 아래와 같습니다. ① 은 최소제곱법을 이용하여 구한 직선입니다.② 는 ① 선상위의 값으로 예측값을..