일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- html
- version 2
- 혼합효과모형
- 정규분포
- 인공지능
- 에세이
- 이원배치 분산분석
- 해운업
- r
- 산점도
- 변량효과모형
- 경제학
- 추정
- 글쓰기
- 고정효과모형
- css
- 변동분해
- 데이터 과학
- 오블완
- version 1
- 통계학
- 회귀분석
- 티스토리챌린지
- 이항분포
- JavaScript
- 반복있음
- 가설검정
- 반복없음
- 분산분석
- 확률
- Today
- Total
목록통계학 이야기 (109)
생각 작업실 The atelier of thinking
Chapter 47. R을 이용한 확률분포 - 포아송 분포 1. R에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 포아송분포(Poiss..
Chapter 45. 포아송분포(Poisson Distribution) 1. 포아송분포(Poisson Distribution)의 정의 포아송분포는 단위시간 동안 혹은 단위공간에서 어떤 사건이 발생하는 횟수를 나타내는 이산확률분포입니다. 포아송분포는 사건발생률이 일정하고 독립적으로 발생하는 경우에 적용됩니다. 주로 사건 발생에 대한 희귀한 사건을 모델링하는 데 사용됩니다. 예를 들어 단위 시간당 발생하는 교통사고 수, 단위 면적당 나타나는 군락의 개수, 자연재해의 발생률 등을 모델링할 때 사용됩니다. 2. 포아송분포 확률변수 포아송분포의 확률변수는 일정한 시간, 공간 또는 구간에서 발생하는 사건의 수를 나타내는데 사용됩니다. 이 확률변수를 일반적으로 "X"로 표기합니다. 포아송 분포는 다음과 같이 표현합니..
Chapter 45. R을 이용한 확률분포 - 초기하분포 구하기 1. R에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 초기하분포(Hy..
Chapter 44. 초기하분포(Hypergeometric Distribution) 1. 초기하분포 (Hypergeometric Distribution)의 정의 초기하분포는 이항분포와 비슷한 분포이지만, 복원추출이 아닌 비복원추출에서의 확률분포입니다. 유한모집단이 두 그룹으로 나누어져 있고 표본을 비복원으로 추출할 때, 특정 그룹에서 뽑힌 표본의 수에 대한 확률분포입니다. 이항분포에서 성공과 실패 두 그룹에서 뽑는 것은 같지만, 비복원추출이고 각 시행은 독립이 아니라는 점에 차이가 있습니다. 2. 초기하분포 확률변수 크기가 N인 모집단이 크기가 M과 N-M인 두 개의 부모집단 (A,B)로 나누어진 경우, n개의 표본을 비복원으로 추출할 때, 부모집단(A)에서 추출될 표본의 수가 확률변수 입니다. A에서 ..
Chapter 43. R을 이용한 확률분포 - 이항분포 구하기 1. R에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다.분포별 확률질량(밀도)함수와 누적함수,분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribut..
Chapter 42. 베르누이분포 & 이항분포 1. 베르누이분포 ( Bernoulli Distribution) (1) 베르누이 시행(Bernoulli Trial) 두 가지의 결과만을 가지는 실험을 말합니다. 이러한 시행에서 각각의 결과를 성공(success)과 실패(failure)로 정의합니다. ( S/F ) 예를 들어, 동전을 한 번 던져서 앞면이나 뒷면이 나오게 하는 것도 베르누이 시행입니다. 베르누이 시행은 아래와 같이 3가지의 특징이 있습니다. ① 각 실험에서 발생 가능한 결과는 단 2가지이다. 예) 성공/실패, 앞면/뒷면 ② 각 실험이 독립적으로 수행한다. ③ 모든 실험에서 결과의 확률은 항상 동일하다. ◈ 예제 : 불량품 검사 I 10개의 제품 중 3개가 불량품일 때, ▶ 2 개를 복원추출하는..
Chapter 41. 확률분포의 분류 1. 확률분포를 구분하는 이유 통계학에서 주된 관심은 모집단의 특성을 알고자 하는 것입니다. 모집단 전체를 분석하는 것이 가장 정확하겠으나, 대부분의 경우 비용과 시간문제가 발생하여 표본을 추출하여 분석합니다. 이 때 보다 분석에 신뢰를 더해주는 것이 확률입니다. 통계의 기초인 데이터는 확률변수의 관측값이거나 결과입니다. 확률변수는 이 결과를 숫자로 바꿔 수학적 모델링을 가능하게 합니다. 확률분포는 확정변수가 가질 수 있는 모든 값과 그 값이 나타날 확률을 나타내는 함수입니다. 바꿔말하면, 확률분포는 모집단의 특성을 확률적으로 모델링합니다. 따라서 확률분포를 통해 모집단의 특성을 일정한 수학적 형태로 표현하고, 이를 기반으로 확률적인 추론이나 예측을 수행할 수 있습니..
Chapter 40. 확률변수의 공분산과 상관계수 앞서 다변량 자료의 기술통계에서 공분산은 두 변수 사이의 관계를 나타내는 지표로 두 변수의 함께 움직이는 경향을 측정한다고 했습니다. 또한, 상관계수는 두 변수간의 선형관계의 강도와 방향을 나타내는 지표입니다. 확률변수의 기대값, 분산, 표준편차는 확률변수 하나에 관련된 것이라면, 확률변수의 공분산과 상관계수는 두 확률변수사이의 관계를 나타내는 것이라 할 수 있습니다. 1. 확률변수 기대값의 정리 확률변수의 공분산을 구하기 위해서는 확률변수 기대값의 정리를 미리 파악해 둘 필요가 있습니다. $$ E(X+Y) = E(X)+E(Y) $$ $$ X와 Y가 독립이면, E(XY) = E(X) E(Y) $$ 확률변수 X,Y에 대해, X+Y의 기대값을 구한다고 했을 ..
Chapter 39. 확률분포-결합분포&주변분포 1. 결합분포(Joint Distribution) 결합분포는 두 개 이상의 확률변수에 대한 확률분포를 말합니다. 즉, 각각의 변수가 어떤 값을 가질 때 어떤 사건이 일어날 확률을 나타내는 함수입니다. 예를 들어, 두 개의 확률변수 X와 Y를 ( X,Y )로 나타낸다면, 결합분포는 P ( X=x, Y=y )로 표현합니다. 이러한 결합분포는 각 변수의 확률분포를 알면 쉽게 구할 수 있습니다. 결합분포는 두 변수 간의 상관관계를 분석하는데 사용됩니다. 결합분포를 나타내는 확률함수 역시 이산확률변수와 연속확률변수 일 때로 구분하여 각각 결합확률질량함수, 결합확률밀도함수라고 말합니다. (1) 결합확률질량함수(Joint Probability Mass Function)..
Chapter 38. 확률변수의 분산과 표준편차 1. 확률변수의 분산 일변량 자료에 대한 수치적 기술통계에서 표본들이 얼마나 퍼져 있는지를 나타내는 대표적인 것이 분산과 표준편차입니다. 확률변수의 산포를 알아보기 위한 분산과 표준편차를 알아낼 수 있습니다. 확률변수의 분산을 표본분산을 구하는 식으로부터 유도해 올 수 있습니다. (1) 표본분산 분산은 관측값에서 중심위치(평균)를 뺀 값을 제곱하고 그것을 모두 더한 값입니다. 표본공간은 확률실험에서 나왔고 나온 원소들을 숫자로 바꿔 주는 것이 확률변수입니다. 따라서 확률변수는 수치자료라 할 수 있습니다. 확률변수의 분산을 구할 때 일단 표본분산의 방법에서 시작합니다. 표본분산을 구하는 식은 아래와 같습니다. 표본크기를 n이라 할 때, $$ S^2 = \fr..