일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- version 1
- 추정
- 확률
- 혼합효과모형
- JavaScript
- 분산분석
- 정규분포
- 회귀분석
- 가설검정
- r
- 이원배치 분산분석
- 산점도
- 두 평균의 비교
- 통계학
- version 2
- html
- 에세이
- 오블완
- 반복있음
- 데이터 과학
- 경제학
- 인공지능
- 고정효과모형
- 반복없음
- css
- 이항분포
- 티스토리챌린지
- 글쓰기
- 변량효과모형
- 변동분해
- Today
- Total
목록분류 전체보기 (197)
생각 작업실 The atelier of thinking
Chapter 45. R을 이용한 확률분포 - 초기하분포 구하기 1. R에서의 확률분포 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribution function - 누적함수 q : quantile function - 분위수 r : random number generator - 램덤 생성 작업 2. 초기하분포(Hy..
Chapter 44. 초기하분포(Hypergeometric Distribution) 1. 초기하분포 (Hypergeometric Distribution)의 정의 초기하분포는 이항분포와 비슷한 분포이지만, 복원추출이 아닌 비복원추출에서의 확률분포입니다. 유한모집단이 두 그룹으로 나누어져 있고 표본을 비복원으로 추출할 때, 특정 그룹에서 뽑힌 표본의 수에 대한 확률분포입니다. 이항분포에서 성공과 실패 두 그룹에서 뽑는 것은 같지만, 비복원추출이고 각 시행은 독립이 아니라는 점에 차이가 있습니다. 2. 초기하분포 확률변수 크기가 N인 모집단이 크기가 M과 N-M인 두 개의 부모집단 (A,B)로 나누어진 경우, n개의 표본을 비복원으로 추출할 때, 부모집단(A)에서 추출될 표본의 수가 확률변수 입니다. A에서 ..
Chapter 43. R을 이용한 확률분포 - 이항분포 구하기 1. R에서의 확률분포 R에서는 이산확률분포와 연속확률분포 모두 다 제공합니다.분포별 확률질량(밀도)함수와 누적함수,분위수 및 랜덤 작업 등을 실행할 수 있습니다. 각 분포의 코드는 아래와 같습니다. 이산확률분포 연속확률분포 이항분포 binom 정규분포 norm 초기하분포 hyper T분포 t 포아송분포 pois F분포 f 기하분포 geom 카이분포 chisq 음이항분포 nbionom 균등분포 unif 다항분포 multinom 지수분포 exp 구하고자 하는 함수에 따라 아래의 접두사를 붙여 사용하면 됩니다. d : probability mass/density function - 확률 질량/밀도 함수 p : cumulative distribut..
Chapter 42. 베르누이분포 & 이항분포 1. 베르누이분포 ( Bernoulli Distribution) (1) 베르누이 시행(Bernoulli Trial) 두 가지의 결과만을 가지는 실험을 말합니다. 이러한 시행에서 각각의 결과를 성공(success)과 실패(failure)로 정의합니다. ( S/F ) 예를 들어, 동전을 한 번 던져서 앞면이나 뒷면이 나오게 하는 것도 베르누이 시행입니다. 베르누이 시행은 아래와 같이 3가지의 특징이 있습니다. ① 각 실험에서 발생 가능한 결과는 단 2가지이다. 예) 성공/실패, 앞면/뒷면 ② 각 실험이 독립적으로 수행한다. ③ 모든 실험에서 결과의 확률은 항상 동일하다. ◈ 예제 : 불량품 검사 I 10개의 제품 중 3개가 불량품일 때, ▶ 2 개를 복원추출하는..
Chapter 41. 확률분포의 분류 1. 확률분포를 구분하는 이유 통계학에서 주된 관심은 모집단의 특성을 알고자 하는 것입니다. 모집단 전체를 분석하는 것이 가장 정확하겠으나, 대부분의 경우 비용과 시간문제가 발생하여 표본을 추출하여 분석합니다. 이 때 보다 분석에 신뢰를 더해주는 것이 확률입니다. 통계의 기초인 데이터는 확률변수의 관측값이거나 결과입니다. 확률변수는 이 결과를 숫자로 바꿔 수학적 모델링을 가능하게 합니다. 확률분포는 확정변수가 가질 수 있는 모든 값과 그 값이 나타날 확률을 나타내는 함수입니다. 바꿔말하면, 확률분포는 모집단의 특성을 확률적으로 모델링합니다. 따라서 확률분포를 통해 모집단의 특성을 일정한 수학적 형태로 표현하고, 이를 기반으로 확률적인 추론이나 예측을 수행할 수 있습니..
Chapter 40. 확률변수의 공분산과 상관계수 앞서 다변량 자료의 기술통계에서 공분산은 두 변수 사이의 관계를 나타내는 지표로 두 변수의 함께 움직이는 경향을 측정한다고 했습니다. 또한, 상관계수는 두 변수간의 선형관계의 강도와 방향을 나타내는 지표입니다. 확률변수의 기대값, 분산, 표준편차는 확률변수 하나에 관련된 것이라면, 확률변수의 공분산과 상관계수는 두 확률변수사이의 관계를 나타내는 것이라 할 수 있습니다. 1. 확률변수 기대값의 정리 확률변수의 공분산을 구하기 위해서는 확률변수 기대값의 정리를 미리 파악해 둘 필요가 있습니다. $$ E(X+Y) = E(X)+E(Y) $$ $$ X와 Y가 독립이면, E(XY) = E(X) E(Y) $$ 확률변수 X,Y에 대해, X+Y의 기대값을 구한다고 했을 ..
Chapter 39. 확률분포-결합분포&주변분포 1. 결합분포(Joint Distribution) 결합분포는 두 개 이상의 확률변수에 대한 확률분포를 말합니다. 즉, 각각의 변수가 어떤 값을 가질 때 어떤 사건이 일어날 확률을 나타내는 함수입니다. 예를 들어, 두 개의 확률변수 X와 Y를 ( X,Y )로 나타낸다면, 결합분포는 P ( X=x, Y=y )로 표현합니다. 이러한 결합분포는 각 변수의 확률분포를 알면 쉽게 구할 수 있습니다. 결합분포는 두 변수 간의 상관관계를 분석하는데 사용됩니다. 결합분포를 나타내는 확률함수 역시 이산확률변수와 연속확률변수 일 때로 구분하여 각각 결합확률질량함수, 결합확률밀도함수라고 말합니다. (1) 결합확률질량함수(Joint Probability Mass Function)..
Chapter 38. 확률변수의 분산과 표준편차 1. 확률변수의 분산 일변량 자료에 대한 수치적 기술통계에서 표본들이 얼마나 퍼져 있는지를 나타내는 대표적인 것이 분산과 표준편차입니다. 확률변수의 산포를 알아보기 위한 분산과 표준편차를 알아낼 수 있습니다. 확률변수의 분산을 표본분산을 구하는 식으로부터 유도해 올 수 있습니다. (1) 표본분산 분산은 관측값에서 중심위치(평균)를 뺀 값을 제곱하고 그것을 모두 더한 값입니다. 표본공간은 확률실험에서 나왔고 나온 원소들을 숫자로 바꿔 주는 것이 확률변수입니다. 따라서 확률변수는 수치자료라 할 수 있습니다. 확률변수의 분산을 구할 때 일단 표본분산의 방법에서 시작합니다. 표본분산을 구하는 식은 아래와 같습니다. 표본크기를 n이라 할 때, $$ S^2 = \fr..
Chapter 37. 확률변수의 기대값(Expected Value) 확률변수의 통계량은 확률분포를 표현하기 위한 값들이며, 이 값들은 확률함수를 통해 계산할 수 있습니다. 1. 기대값(Expected Value) 확률변수의 기대값은 해당 확률변수가 가질 수 있는 각 값에 대해 그 값들의 가중 평균을 계산한 것이라 말할 수 있습니다. 기대값은 확률변수의 "평균적인" 값으로 생각할 수 있습니다. 확률변수에 대해 평균적으로 기대하는 값 = 모평균(population mean) = 확률분포(또는 모집단)의 무게중심 하나의 확률과정에 의해 결정되는 숫자는 하나의 값 주위로 분포합니다. 이 때 기대값(Expected Value)은 분포의 무게중심에 해당되는 값입니다. 즉 확률변수의 기대값은 확률분포의 중심위치를 말..
Chapter 36. 확률함수 - 확률질량함수 & 확률밀도함수 1. 확률변수, 확률함수, 확률분포 앞서 확률변수는 특정 확률실험에서 발생 가능한 결과를 수치화한 것을 의미한다고 하였습니다. 확률분포는 확률변수가 가질 수 있는 모든 값에 대한 확률을 말한다고 했습니다. 확률함수란 확률변수가 가질 수 있는 모든 값에 대해 해당 값이 나올 확률을 나타내는 함수를 말합니다. 이 셋의 관계를 정리하면 " 확률실험 내 모든 확률변수가 확률함수를 통하여 나온 값들의 집합이 확률분포이다."라고 표현할 수 있습니다. 확률변수의 형태는 표본공간의 원소의 형태에 따라 셀 수 있는 이산자료에서 나온 이산확률변수와 연속형 실수에서 나온 연속확률변수로 나눌 수 있습니다. 확률함수는 확률변수의 값을 입력받아 해당 갑이 나타날 확률..