일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- version 2
- 데이터 과학
- 회귀분석
- 추정
- 이원배치 분산분석
- 정규분포
- 이항분포
- 에세이
- html
- 인공지능
- 확률
- 고정효과모형
- 해운업
- 경제학
- version 1
- 반복있음
- 반복없음
- 오블완
- 변동분해
- 변량효과모형
- 가설검정
- 혼합효과모형
- JavaScript
- 글쓰기
- 산점도
- css
- 티스토리챌린지
- 통계학
- 분산분석
- r
- Today
- Total
목록분류 전체보기 (210)
생각 작업실 The atelier of thinking

Chapter 48. 기하분포와 음이항분포 기하분포와 음이항분포는 모두 이항분포에서 파생된 분포로, 이항분포와 관련된 확률문제를 해결하는데 사용됩니다. 기하분포는 이항분포에서 성공확률이 일정하고 시행횟수가 무한히 많아지는 경우, 즉 시행횟수가 많아지면서 확률이 점점 작아지는 경우를 다루는 분포입니다. 예를 들어, 동전을 던져서 앞면이 나올 확률이 0.5로 일정하고, 앞면이 처음으로 나오는 시행횟수를 기록한다면, 이 시행횟수가 따르는 분포가 기하분포입니다. 즉 기하분포는 단일 베르누이 시행에서 첫번째 성공까지 시행한 횟수가 따르는 이산확률분포입니다. 음이항분포는 이항분포에서 시행횟수가 일정하고 성공확률이 일정한 경우(기하분포)를 다루는 대신, 시행횟수는 일정하지 않고 성공횟수가 일정한 경우를 다루는 분포입..

Chapter 47. R을 이용한 확률분포 - 포아송 분포 1. R에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 포아송분포(Poiss..

Chapter 45. 포아송분포(Poisson Distribution) 1. 포아송분포(Poisson Distribution)의 정의 포아송분포는 단위시간 동안 혹은 단위공간에서 어떤 사건이 발생하는 횟수를 나타내는 이산확률분포입니다. 포아송분포는 사건발생률이 일정하고 독립적으로 발생하는 경우에 적용됩니다. 주로 사건 발생에 대한 희귀한 사건을 모델링하는 데 사용됩니다. 예를 들어 단위 시간당 발생하는 교통사고 수, 단위 면적당 나타나는 군락의 개수, 자연재해의 발생률 등을 모델링할 때 사용됩니다. 2. 포아송분포 확률변수 포아송분포의 확률변수는 일정한 시간, 공간 또는 구간에서 발생하는 사건의 수를 나타내는데 사용됩니다. 이 확률변수를 일반적으로 "X"로 표기합니다. 포아송 분포는 다음과 같이 표현합니..

Chapter 45. R을 이용한 확률분포 - 초기하분포 구하기 1. R에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 초기하분포(Hy..

Chapter 44. 초기하분포(Hypergeometric Distribution) 1. 초기하분포 (Hypergeometric Distribution)의 정의 초기하분포는 이항분포와 비슷한 분포이지만, 복원추출이 아닌 비복원추출에서의 확률분포입니다. 유한모집단이 두 그룹으로 나누어져 있고 표본을 비복원으로 추출할 때, 특정 그룹에서 뽑힌 표본의 수에 대한 확률분포입니다. 이항분포에서 성공과 실패 두 그룹에서 뽑는 것은 같지만, 비복원추출이고 각 시행은 독립이 아니라는 점에 차이가 있습니다. 2. 초기하분포 확률변수 크기가 N인 모집단이 크기가 M과 N-M인 두 개의 부모집단 (A,B)로 나누어진 경우, n개의 표본을 비복원으로 추출할 때, 부모집단(A)에서 추출될 표본의 수가 확률변수 입니다. A에서 ..

Chapter 43. R을 이용한 확률분포 - 이항분포 구하기 1. R에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다.분포별 확률질량(밀도)함수와 누적함수,분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribut..

Chapter 42. 베르누이분포 & 이항분포 1. 베르누이분포 ( Bernoulli Distribution) (1) 베르누이 시행(Bernoulli Trial) 두 가지의 결과만을 가지는 실험을 말합니다. 이러한 시행에서 각각의 결과를 성공(success)과 실패(failure)로 정의합니다. ( S/F ) 예를 들어, 동전을 한 번 던져서 앞면이나 뒷면이 나오게 하는 것도 베르누이 시행입니다. 베르누이 시행은 아래와 같이 3가지의 특징이 있습니다. ① 각 실험에서 발생 가능한 결과는 단 2가지이다. 예) 성공/실패, 앞면/뒷면 ② 각 실험이 독립적으로 수행한다. ③ 모든 실험에서 결과의 확률은 항상 동일하다. ◈ 예제 : 불량품 검사 I 10개의 제품 중 3개가 불량품일 때, ▶ 2 개를 복원추출하는..

Chapter 41. 확률분포의 분류 1. 확률분포를 구분하는 이유 통계학에서 주된 관심은 모집단의 특성을 알고자 하는 것입니다. 모집단 전체를 분석하는 것이 가장 정확하겠으나, 대부분의 경우 비용과 시간문제가 발생하여 표본을 추출하여 분석합니다. 이 때 보다 분석에 신뢰를 더해주는 것이 확률입니다. 통계의 기초인 데이터는 확률변수의 관측값이거나 결과입니다. 확률변수는 이 결과를 숫자로 바꿔 수학적 모델링을 가능하게 합니다. 확률분포는 확정변수가 가질 수 있는 모든 값과 그 값이 나타날 확률을 나타내는 함수입니다. 바꿔말하면, 확률분포는 모집단의 특성을 확률적으로 모델링합니다. 따라서 확률분포를 통해 모집단의 특성을 일정한 수학적 형태로 표현하고, 이를 기반으로 확률적인 추론이나 예측을 수행할 수 있습니..

Chapter 40. 확률변수의 공분산과 상관계수 앞서 다변량 자료의 기술통계에서 공분산은 두 변수 사이의 관계를 나타내는 지표로 두 변수의 함께 움직이는 경향을 측정한다고 했습니다. 또한, 상관계수는 두 변수간의 선형관계의 강도와 방향을 나타내는 지표입니다. 확률변수의 기대값, 분산, 표준편차는 확률변수 하나에 관련된 것이라면, 확률변수의 공분산과 상관계수는 두 확률변수사이의 관계를 나타내는 것이라 할 수 있습니다. 1. 확률변수 기대값의 정리 확률변수의 공분산을 구하기 위해서는 확률변수 기대값의 정리를 미리 파악해 둘 필요가 있습니다. $$ E(X+Y) = E(X)+E(Y) $$ $$ X와 Y가 독립이면, E(XY) = E(X) E(Y) $$ 확률변수 X,Y에 대해, X+Y의 기대값을 구한다고 했을 ..

Chapter 39. 확률분포-결합분포&주변분포 1. 결합분포(Joint Distribution) 결합분포는 두 개 이상의 확률변수에 대한 확률분포를 말합니다. 즉, 각각의 변수가 어떤 값을 가질 때 어떤 사건이 일어날 확률을 나타내는 함수입니다. 예를 들어, 두 개의 확률변수 X와 Y를 ( X,Y )로 나타낸다면, 결합분포는 P ( X=x, Y=y )로 표현합니다. 이러한 결합분포는 각 변수의 확률분포를 알면 쉽게 구할 수 있습니다. 결합분포는 두 변수 간의 상관관계를 분석하는데 사용됩니다. 결합분포를 나타내는 확률함수 역시 이산확률변수와 연속확률변수 일 때로 구분하여 각각 결합확률질량함수, 결합확률밀도함수라고 말합니다. (1) 결합확률질량함수(Joint Probability Mass Function)..