일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 오블완
- r
- html
- 정규분포
- 반복없음
- css
- 변동분해
- 통계학
- 고정효과모형
- 인공지능
- 가설검정
- 회귀분석
- 글쓰기
- 이항분포
- 두 평균의 비교
- 반복있음
- 확률
- 변량효과모형
- version 1
- JavaScript
- 분산분석
- 이원배치 분산분석
- 혼합효과모형
- 티스토리챌린지
- 데이터 과학
- version 2
- 에세이
- 경제학
- 산점도
- 추정
- Today
- Total
목록통계학 이야기 (109)
생각 작업실 The atelier of thinking
Chapter 37. 확률변수의 기대값(Expected Value) 확률변수의 통계량은 확률분포를 표현하기 위한 값들이며, 이 값들은 확률함수를 통해 계산할 수 있습니다. 1. 기대값(Expected Value) 확률변수의 기대값은 해당 확률변수가 가질 수 있는 각 값에 대해 그 값들의 가중 평균을 계산한 것이라 말할 수 있습니다. 기대값은 확률변수의 "평균적인" 값으로 생각할 수 있습니다. 확률변수에 대해 평균적으로 기대하는 값 = 모평균(population mean) = 확률분포(또는 모집단)의 무게중심 하나의 확률과정에 의해 결정되는 숫자는 하나의 값 주위로 분포합니다. 이 때 기대값(Expected Value)은 분포의 무게중심에 해당되는 값입니다. 즉 확률변수의 기대값은 확률분포의 중심위치를 말..
Chapter 36. 확률함수 - 확률질량함수 & 확률밀도함수 1. 확률변수, 확률함수, 확률분포 앞서 확률변수는 특정 확률실험에서 발생 가능한 결과를 수치화한 것을 의미한다고 하였습니다. 확률분포는 확률변수가 가질 수 있는 모든 값에 대한 확률을 말한다고 했습니다. 확률함수란 확률변수가 가질 수 있는 모든 값에 대해 해당 값이 나올 확률을 나타내는 함수를 말합니다. 이 셋의 관계를 정리하면 " 확률실험 내 모든 확률변수가 확률함수를 통하여 나온 값들의 집합이 확률분포이다."라고 표현할 수 있습니다. 확률변수의 형태는 표본공간의 원소의 형태에 따라 셀 수 있는 이산자료에서 나온 이산확률변수와 연속형 실수에서 나온 연속확률변수로 나눌 수 있습니다. 확률함수는 확률변수의 값을 입력받아 해당 갑이 나타날 확률..
Chapter 35. 확률변수와 확률분포 1. 도대체 확률이란 무엇인가? 확률이란 말은 여러 측면에서 다양하게 사용됩니다. 통계학에서의 확률은 어떤 사건(event)이 일어날 가능성을 수학적으로 측정한 것을 말합니다. (1) 고전적 확률(Classical Probability) 통계에서 언급하는 확률은 대부분 고전적 확률을 의미합니다. 주사위 던지기와 동전 던지기와 같이 모든 결과가 나올 확률이 동일하다는 전제하에 특정 사건이 나올 확률을 계산합니다. (2) 나열 확률(Enumerative Probability) 모든 가능한 경우를 생각하고 그 중 내가 관심이 있는 사건이 일어나는 비율을 생각합니다. 예를 들면 검은색 공 3개와 빨간색 공 2개가 들어 있는 상자에서 공을 하나 꺼낼 때 빨간 공이 나올 확..
Chapter 34. 조건부 확률 - 베이즈 정리의 활용 1. 사전확률 & 사후확률 베이즈 정리는 두 확률 변수의 사전확률과 사후확률 사이의 관계를 나타내는 정리이기도 합니다. 즉, 원인과 결과 형태의 문제에서 결과에 대한 원인 분석이 가능하게 하는 이론입니다. (1) 사전확률 (Prior Probability) P(B|A) 는 순서적으로 볼 때, 대부분 사건 A가 먼저 발생하고 B가 이어 발생하는 상황에 대한 확률을 말한다. A는 원인 B는 결과라고 볼 수 있습니다. 이렇게 원인에서 결과를 도출해내는 것을 전향적 연구(prospective study)라고 합니다. 코호트 연구(Cohort Study)가 대표적인 예라 할 수 있습니다.여기서 원인인 사건 A의 가능성을 P(A) 또는 P(A)의 여사건은 결..
Chapter 33. 조건부 확률 - 베이즈 정리(Bayes' theorem) 1. 베이즈 정리 (Bayes's theorem) 베이즈 정리는 확률 이론에서 조건부 확률을 계산하는 데 사용되는 중요한 정리입니다. 베이즈 정리는 두 확률 변수의 사전확률과 사후 확률 사이의 관계를 나타내며, 원인과 결과 형태의 문제를 결과에 대한 원인 분석이 가능하게 하는 이론입니다. 베이즈 정리를 처음으로 제시한 사람은 영국의 수학자, 신학자인 토마스 베이즈(Thomas Bayes, 1701 ~ 1773)입니다. 그는 다양한 분야의 연구를 수행하였으며, 그의 이름이 붙은 '베이즈 정리'는 그의 사후에 연구자료를 정리하면서 발견되었다고 합니다. 다만, 초기에는 큰 주목을 받지 못하였지만 이 이론은 현대 통계학과 머신러닝에서..
Chapter 32. 고전적 확률 vs 조건부 확률 1. 확률의 기원 슈발리에 드 메레 (Chevalier de Mere)의 질문에서 시작되엇다고 합니다. 1650년대 프랑스 작가 슈발리에 드 메레는 다음과 같은 도박 문제를 고심하고 있었다고 합니다. 게임 1 : 최대 4번까지 공정한 주사위를 한 개 던지는데 6이 나오면 이긴다. 게임 2 : 최대 24번까지 공정한 주사위를 두 개 던지는데 둘 다 6이 나오면 이긴다. 과연 어느 게임이 더 유리한 게임일까요? 이 문제에 대한 해답을 구하기 위해 드 메레가 도움을 청한 사람은 파스칼이었고, 파스칼은 그의 친구 페르마와 같이 확률론의 기반을 다지게 되었다고 합니다. 각 게임의 확률을 구해보면 아래와 같습니다. (1) 게임 1 : 최대 4번까지 공정한 주사위를..
Chapter 31. R을 이용한 경우의 수 구하기 지난 회차에 확률과 경우의 수에 대해서 알아봤습니다. 2023.10.08 - [통계학 이야기] - 30. 확률과 경우의 수(The Number of Cases) 30. 확률과 경우의 수(The Number of Cases) Chapter 30. 확률과 경우의 수 1. 경우의 수 확률을 계산하기 위해서는 표본공간과 사건에 있는 원소의 갯수를 효율적으로 계산하는 것이 중요합니다. 즉, 표본공간의 크기와 사건의 크기를 알아내 thinking-atelier.tistory.com 주머니 안에 1부터 10까지의 10개 공이 있을 때, 공을 3개 추출하는 방법과 순서 고려 여부에 따라 경우의 수를 구해보고자 합니다. 1. 중복 순열 중복순열은 복원추출이고 순서를 고..
Chapter 30. 확률과 경우의 수 1. 경우의 수 확률을 계산하기 위해서는 표본공간과 사건에 있는 원소의 갯수를 효율적으로 계산하는 것이 중요합니다. 즉, 표본공간의 크기와 사건의 크기를 알아내는 것이 필요합니다. 경우의 수는 어떤 사건이나 실험에서 일어날 수 있는 모든 가능한 경우의 개수를 나타냅니다. 간단히 말하면, 특정 상황에서 발생 가능한 다양한 선택 또는 결과의 수를 의미합니다. 경우의 수를 알면 각 결과가 일어날 확률을 계산할 수 있으며, 이를 통해 다양한 확률적 문제를 해결할 수 있습니다. 경우의 수를 구하는 기본 법칙은 곱의 법칙(multiplication rule) 입니다. 곱의 법칙이란 예를 들어 어떤 실험이 m 개의 연속된 단계로 이루어져 있고, i 번째 단계에서 발생가능한 결과..
Chapter 29. 확률의 공리와 기본정리 1. 확률의 공리 (Axiom) 공리적 확률이란 확률 이론의 기초를 이루는 기본 원칙들로 확률을 정의하고 이에 대한 성질을 명시하는 규칙들을 말합니다. 공리적 확률은 증명할 필요가 없는 확률의 기본적인 원리로서, 확률 이론의 출발점이며 기반이 되는 핵심 원리를 의미합니다.이러한 원리들은 논리적으로 증명할 수 없고, 확률 이론을 구축하기 위해 가정하는 필수적인 규칙들입니다. 이러한 규칙들이 없으면 확률에 대한 일관된 체계를 가질 수 없습니다. (1) 음의 확률은 없다. 모든 사건에 대한 확률은 음수가 아니어야 합니다. 확률은 항상 0 또는 양수여야 하며, 음수가 될 수 없습니다. (2) 전체 표본 공간의 확률은 1 이다. 표본 공간 Ω 전체에 대한 확률은 1 이..
Chapter 28. 확률과 통계 1. 확률과 통계 (1) 확률과 통계는 왜 함께 다닐까? 확률은 불확실성을 다루기 위한 수학적 도구이고, 통계는 데이터를 수집,요약,분석하여 패턴을 파악하는 학문이라 할 수 있습니다. 이러한 이유로 확률과 통계는 밀접한 관계를 가지고 있습니다. 확률은 통계의 기초라고 말할 수 있습니다. 데이터를 분석하고 추론하기 위해서는 데이터가 어떤 분포를 따르는지, 그 분포의 모수는 무엇인지 등을 알아야하는데, 이 때 확률분포를 사용하면 데이터를 모델링하고 모수를 추정할 수 있습니다. 반대로, 통계는 확률을 응용하는 분야라 말할 수 있습니다. 확률 분포를 사용하여 데이터를 모델링하고 모수를 추정한 후, 이를 토대로 가설 검정, 신뢰 구간 추정 등을 수행합니다. 이러한 통계적 방법을 ..