일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 티스토리챌린지
- 정규분포
- 산점도
- 데이터 과학
- 통계학
- 혼합효과모형
- 추정
- 이항분포
- 가설검정
- 오블완
- 반복있음
- r
- JavaScript
- html
- 두 평균의 비교
- 인공지능
- version 1
- css
- 고정효과모형
- 변량효과모형
- 경제학
- 반복없음
- 글쓰기
- 변동분해
- version 2
- 회귀분석
- 분산분석
- 확률
- 이원배치 분산분석
- 에세이
- Today
- Total
목록분류 전체보기 (197)
생각 작업실 The atelier of thinking
Chapter 54. 표집분포와 대수의 법칙 그리고 중심극한정리 모집단의 모수를 알 수 없기 때문에 이론적으로 표본에서 추출한 모든 표본에 대해 통계량을 계산할 수는 없습니다. 따라서, 표본에서 얻은 통계량이나 검정통계량 등이 어느 정도의 변동성을 가지는 지에 대한 정보를 이용하여 추론을 하게 됩니다. 이 때, 표본에서 얻은 통계량의 분포를 표집분포라고 부르며, 표집분포를 이용하여 통계적 추론을 수행합니다. 1. 표집분포(Sampling Distribution) 표집분포는 한마디로 정의하면 통계량의 확률분포입니다. 여기서 통계량이란 측정가능한 확률표본의 함수를 말합니다. 관심이 가는 통계량으로는 표본평균, 표본분산, 표본표준편차 등이 있습니다. 이런 통계량들이 모수와 연관되어 있기 때문에 모집단을 추정하..
Chapter 53. 표집분포와 확률표본 그리고 통계량 1. 확률표본(Random Sample) (1) 확률표본이란 확률표본은 모집단에서 무작위로 추출한 표본으로, 각각의 표본은 동일한 확률로 추출된다는 특징을 가지고 있습니다. 이를 통해 표본이 모집단을 대표하고 있다고 가정할 수 있으며, 통계적 추론을 할 때 이를 이용하여 모집단의 특성을 추정하거나 가설 검정을 수행합니다. 즉, 확률표본은 통계적 추론의 첫 걸음입니다. 확률표본은 모집단에서 추출한 표본으로, 이를 통해 확률분포를 추정할 수 있다. 확률분포는 확률표본으로부터 구한 통계량의 분포를 의미한다. 예를 들어, 키에 대한 모집단 분포를 추정하기 위해 무작위로 표본을 추출할 때, 이를 통해 추정한 통계량인 평균과 표준편차를 이용하여 정규분포를 추정..
Chapter 52. 정규분포(Normal Distribution) 구하기 1. R 에서의 확률분포이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quantile function - 분위수r : random number generator - 램덤 생성 작업 2. 정규분포 정규분포의 확률밀도 함수는 아래와 같습니다. $..
Chapter 52. 정규분포(Normal Distribution) 1. 정규분포(Normal Distribution)의 유래 통계학 분야에서 가장 중요한 분포로서 정규분포를 꼽고 있습니다. 이 정규분포와 함께 가우스와 피어슨이라는 두 수학자가 자주 언급되고 있습니다. (1) 가우스(Gauss) 가우스(Gauss) 또는 카를 프리드리히 가우스(Carl Friedrich Gauss)는 18세기 말부터 19세기초에 걸쳐 살았던 독일의 수학자,천문학자,물리학자,통계학자, 지리학자입니다. 그의 이름은 통계학에서 잘 알려져 있습니다. 가우스는 통계학 분야에서는 최소제곱법과 정규분포를 중심으로 한 연구를 했습니다. 최소제곱법은 특정한 데이터 셋과 가장 근접한 직선을 찾는 방법으로, 데이터 분석에서 매우 중요한 개념..
Chapter 51. 다항분포 구하기 1. R 에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 다항분포(Multinomial Distr..
Chapter 50. 다항분포(Multinomial Distribution) 1. 다항분포의 정의 다항분포는 여러 개의 값을 가질 수 있는 독립확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각각의 값이 특정 횟수가 나타날 확률을 정의합니다. 이항분포의 확장된 형태라고 할 수 있습니다. 다항분포에서 차원이 2인 경우는 이항분포가 됩니다. 이항분포를 그림으로 표현하면 아래와 같습니다. 다항분포를 그림으로 표현하면 아래와 같습니다. 각 시행에서 나온 결과(S)는 k개이고 각 결과의 횟수(X)가 각각의 확률변수가 됩니다. 각 시행에서 결과의 확률(P)들의 합은 1이 됩니다. $$ \sum_{i=1}^k p_i = 1 $$ n 번 시행했을 때, 각 결과의 횟수를 도수분포표로 나타내면, 시행 결과(S) ..
Chapter 49. R을 이용한 확률분포 - 기하분포 & 음이항분포 1. R 에서의 확률분포 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quantile function - 분위수r : random number generator - 램덤 생성 작업 2. 기하분포(Geometric Distribution)기하분포는 ..
Chapter 48. 기하분포와 음이항분포 기하분포와 음이항분포는 모두 이항분포에서 파생된 분포로, 이항분포와 관련된 확률문제를 해결하는데 사용됩니다. 기하분포는 이항분포에서 성공확률이 일정하고 시행횟수가 무한히 많아지는 경우, 즉 시행횟수가 많아지면서 확률이 점점 작아지는 경우를 다루는 분포입니다. 예를 들어, 동전을 던져서 앞면이 나올 확률이 0.5로 일정하고, 앞면이 처음으로 나오는 시행횟수를 기록한다면, 이 시행횟수가 따르는 분포가 기하분포입니다. 즉 기하분포는 단일 베르누이 시행에서 첫번째 성공까지 시행한 횟수가 따르는 이산확률분포입니다. 음이항분포는 이항분포에서 시행횟수가 일정하고 성공확률이 일정한 경우(기하분포)를 다루는 대신, 시행횟수는 일정하지 않고 성공횟수가 일정한 경우를 다루는 분포입..
Chapter 47. R을 이용한 확률분포 - 포아송 분포 1. R에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 포아송분포(Poiss..
Chapter 45. 포아송분포(Poisson Distribution) 1. 포아송분포(Poisson Distribution)의 정의 포아송분포는 단위시간 동안 혹은 단위공간에서 어떤 사건이 발생하는 횟수를 나타내는 이산확률분포입니다. 포아송분포는 사건발생률이 일정하고 독립적으로 발생하는 경우에 적용됩니다. 주로 사건 발생에 대한 희귀한 사건을 모델링하는 데 사용됩니다. 예를 들어 단위 시간당 발생하는 교통사고 수, 단위 면적당 나타나는 군락의 개수, 자연재해의 발생률 등을 모델링할 때 사용됩니다. 2. 포아송분포 확률변수 포아송분포의 확률변수는 일정한 시간, 공간 또는 구간에서 발생하는 사건의 수를 나타내는데 사용됩니다. 이 확률변수를 일반적으로 "X"로 표기합니다. 포아송 분포는 다음과 같이 표현합니..