일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 정규분포
- 에세이
- 이항분포
- 오블완
- 티스토리챌린지
- 회귀분석
- version 2
- 변동분해
- version 1
- 반복없음
- 통계학
- 반복있음
- JavaScript
- 글쓰기
- 추정
- css
- 데이터 과학
- 고정효과모형
- 변량효과모형
- 산점도
- 경제학
- r
- 두 평균의 비교
- 혼합효과모형
- 이원배치 분산분석
- html
- 분산분석
- 인공지능
- 확률
- 가설검정
- Today
- Total
목록심슨의 역설 (2)
생각 작업실 The atelier of thinking
34일차 평균의 한계 버클리대는 성차별을 했을까? 1970년대에 버클리 대학교는 때아닌 성차별 논란에 빠진 적이 있다. 논란의 발단은 대학원 입학생 중 남학생의 합격률이 여학생의 합격률보다 높게 나오면서 시작되었다. 당시 버클리 대학원 입학 데이터를 보면 남학생들의 합격률은 45%, 여학생들의 합격률은 30% 였다. 이로 인해 성차별 논란이 불거졌다. 이 합격률 차이만 본다면 버클리 대학교에서 남학생을 보다 많이 합격시킨 것으로 보인다. 하지만 학과별로 나누어 세분하여 분석한 결과는 전혀 다른 결론에 도달한다. 아래는 6개 주요 단과 대학의 성별 대학원 입학자료이다. 학과남성여성총지원자합격률총지원자합격률A82562%10882%B56063%2568%C32537%59334%D41733%37535%E19128..
Chapter 16. 수치 자료의 중심 - 평균의 한계 1. 평균의 한계 평균은 데이터의 중심을 대표하는 대표값 중 하나이지만, 모든 경우에서 좋은 대표값이 될 수는 없습니다. 평균이 한계를 보이는 때는 다음과 같습니다. (1) 이상점(outlier)에 민감합니다. 이상치는 데이터 집합의 값 중에서 다른 값들과 동떨어져 있는 값으로, 평균을 구할 때 이상치가 포함되면 평균 값이 크게 영향을 받게 됩니다. (2) 분포의 형태에 따라 왜곡될 수 있습니다. 데이터가 한쪽 방향을 치우쳐져 있거나, 두 개 이상의 그룹으로 나뉘어져 있을 경우에는 평균이 전체 데이터의 대표값이 아닐 수 있습니다. (3) 비교할 때 주의가 필요합니다. 두 집단의 평균을 비교할 때에는 데이터 분포의 형태와 이상치의 영향을 고려해야 합니..