일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 회귀분석
- JavaScript
- 해운업
- 티스토리챌린지
- 경제학
- 산점도
- 분산분석
- 이원배치 분산분석
- css
- 이항분포
- 에세이
- 반복있음
- 통계학
- html
- 혼합효과모형
- 변량효과모형
- 정규분포
- 확률
- version 1
- 가설검정
- 고정효과모형
- 추정
- 반복없음
- 글쓰기
- 변동분해
- 데이터 과학
- r
- 인공지능
- 오블완
- version 2
- Today
- Total
목록통계학 이야기 (109)
생각 작업실 The atelier of thinking
Chapter 56. 이항분포의 정규근사 1. 이항분포의 정규근사란? 이항분포는 대표적인 이산형 확률분포이지만, 표본크기가 충분히 크고 파라미터 값이 적당한 경우에는 정규분포로 근사할 수 있습니다. 이러한 근사를 사용하면, 이항분포를 다루기 어려운 경우에도 정규분포의 성질을 활용하여 다양한 추론을 수행할 수 있습니다. 특히, 정규분포의 선형성과 대칭성, 표준화 등의 성질을 이용하면 이항분포에 대한 확률계산이 간단하고 직관적으로 이루어집니다. 이러한 이율, 이항분포의 정규근사는 통계적 추론에서 매우 중요한 역할을 합니다. 이항분포의 정규근사는 중심극한정리를 기반으로 합니다. 2. 이항분포의 정규근사 모든 이항분포가 정규근사가 가능한 것이 아니라 조건이 어느 정도 갖추어졌을 때 정규근사를 이룰 수 있습니다...
Chapter 55. R을 이용한 표집분포 & 몬테카를로 모의실험 1. 표집분포(Sampling Distribution) 표집분포는 모집단으로부터 표본을 추출했을 때, 어떤 통계량(예: 표본평균,표본분산)의 분포를 말합니다. 표집분포는 모집단으로부터 추출된 표본에서 계산된 통계량의 분포이기 때문에, 모집단에서 추출된 모든 표본에 대한 정보를 제공합니다. 이는 모집단의 모든 개체에 대한 정보를 얻기 어려운 경우에 표집분포를 사용하여 모집단을 추론하는 것이 더 효과적이기 때문입니다. 또한, 표집분포를 사용하면 모집단에 대한 가정이 필요없으며, 모집단의 분포가 무엇인지 알지 못해도 추론을 수행할 수 있습니다. 따라서, 통계적 추론에서는 표집분포를 사용하여 모집단의 특성을 추론하는 것이 일반적입니다. ◈ 예제 ..
Chapter 54. 표집분포와 대수의 법칙 그리고 중심극한정리 모집단의 모수를 알 수 없기 때문에 이론적으로 표본에서 추출한 모든 표본에 대해 통계량을 계산할 수는 없습니다. 따라서, 표본에서 얻은 통계량이나 검정통계량 등이 어느 정도의 변동성을 가지는 지에 대한 정보를 이용하여 추론을 하게 됩니다. 이 때, 표본에서 얻은 통계량의 분포를 표집분포라고 부르며, 표집분포를 이용하여 통계적 추론을 수행합니다. 1. 표집분포(Sampling Distribution) 표집분포는 한마디로 정의하면 통계량의 확률분포입니다. 여기서 통계량이란 측정가능한 확률표본의 함수를 말합니다. 관심이 가는 통계량으로는 표본평균, 표본분산, 표본표준편차 등이 있습니다. 이런 통계량들이 모수와 연관되어 있기 때문에 모집단을 추정하..
Chapter 53. 표집분포와 확률표본 그리고 통계량 1. 확률표본(Random Sample) (1) 확률표본이란 확률표본은 모집단에서 무작위로 추출한 표본으로, 각각의 표본은 동일한 확률로 추출된다는 특징을 가지고 있습니다. 이를 통해 표본이 모집단을 대표하고 있다고 가정할 수 있으며, 통계적 추론을 할 때 이를 이용하여 모집단의 특성을 추정하거나 가설 검정을 수행합니다. 즉, 확률표본은 통계적 추론의 첫 걸음입니다. 확률표본은 모집단에서 추출한 표본으로, 이를 통해 확률분포를 추정할 수 있다. 확률분포는 확률표본으로부터 구한 통계량의 분포를 의미한다. 예를 들어, 키에 대한 모집단 분포를 추정하기 위해 무작위로 표본을 추출할 때, 이를 통해 추정한 통계량인 평균과 표준편차를 이용하여 정규분포를 추정..
Chapter 52. 정규분포(Normal Distribution) 구하기 1. R 에서의 확률분포이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quantile function - 분위수r : random number generator - 램덤 생성 작업 2. 정규분포 정규분포의 확률밀도 함수는 아래와 같습니다. $..
Chapter 52. 정규분포(Normal Distribution) 1. 정규분포(Normal Distribution)의 유래 통계학 분야에서 가장 중요한 분포로서 정규분포를 꼽고 있습니다. 이 정규분포와 함께 가우스와 피어슨이라는 두 수학자가 자주 언급되고 있습니다. (1) 가우스(Gauss) 가우스(Gauss) 또는 카를 프리드리히 가우스(Carl Friedrich Gauss)는 18세기 말부터 19세기초에 걸쳐 살았던 독일의 수학자,천문학자,물리학자,통계학자, 지리학자입니다. 그의 이름은 통계학에서 잘 알려져 있습니다. 가우스는 통계학 분야에서는 최소제곱법과 정규분포를 중심으로 한 연구를 했습니다. 최소제곱법은 특정한 데이터 셋과 가장 근접한 직선을 찾는 방법으로, 데이터 분석에서 매우 중요한 개념..
Chapter 51. 다항분포 구하기 1. R 에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 다항분포(Multinomial Distr..
Chapter 50. 다항분포(Multinomial Distribution) 1. 다항분포의 정의 다항분포는 여러 개의 값을 가질 수 있는 독립확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각각의 값이 특정 횟수가 나타날 확률을 정의합니다. 이항분포의 확장된 형태라고 할 수 있습니다. 다항분포에서 차원이 2인 경우는 이항분포가 됩니다. 이항분포를 그림으로 표현하면 아래와 같습니다. 다항분포를 그림으로 표현하면 아래와 같습니다. 각 시행에서 나온 결과(S)는 k개이고 각 결과의 횟수(X)가 각각의 확률변수가 됩니다. 각 시행에서 결과의 확률(P)들의 합은 1이 됩니다. $$ \sum_{i=1}^k p_i = 1 $$ n 번 시행했을 때, 각 결과의 횟수를 도수분포표로 나타내면, 시행 결과(S) ..
Chapter 49. R을 이용한 확률분포 - 기하분포 & 음이항분포 1. R 에서의 확률분포 이산확률분포연속확률분포이항분포binom정규분포norm초기하분포hyperT분포t포아송분포poisF분포f기하분포geom카이분포chisq음이항분포nbionom균등분포unif다항분포multinom지수분포exp구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다.d : probability mass/density function - 확률 질량/밀도 함수p : cumulative distribution function - 누적함수q : quantile function - 분위수r : random number generator - 램덤 생성 작업 2. 기하분포(Geometric Distribution)기하분포는 ..
Chapter 48. 기하분포와 음이항분포 기하분포와 음이항분포는 모두 이항분포에서 파생된 분포로, 이항분포와 관련된 확률문제를 해결하는데 사용됩니다. 기하분포는 이항분포에서 성공확률이 일정하고 시행횟수가 무한히 많아지는 경우, 즉 시행횟수가 많아지면서 확률이 점점 작아지는 경우를 다루는 분포입니다. 예를 들어, 동전을 던져서 앞면이 나올 확률이 0.5로 일정하고, 앞면이 처음으로 나오는 시행횟수를 기록한다면, 이 시행횟수가 따르는 분포가 기하분포입니다. 즉 기하분포는 단일 베르누이 시행에서 첫번째 성공까지 시행한 횟수가 따르는 이산확률분포입니다. 음이항분포는 이항분포에서 시행횟수가 일정하고 성공확률이 일정한 경우(기하분포)를 다루는 대신, 시행횟수는 일정하지 않고 성공횟수가 일정한 경우를 다루는 분포입..