일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 회귀분석
- 산점도
- 반복있음
- 데이터 과학
- 티스토리챌린지
- 고정효과모형
- version 1
- 변량효과모형
- css
- version 2
- 이항분포
- 반복없음
- 변동분해
- 혼합효과모형
- JavaScript
- 글쓰기
- 이원배치 분산분석
- 정규분포
- 추정
- 확률
- 가설검정
- 분산분석
- 통계학
- 오블완
- r
- 경제학
- 두 평균의 비교
- 인공지능
- 에세이
- html
- Today
- Total
목록분류 전체보기 (197)
생각 작업실 The atelier of thinking
코딩이라는 세계에 들어서기 시작한 것이 어느덧 2년이 지나가고 있습니다. 처음에 코딩이라는 것을 배우고 싶은데 무엇부터 시작해야 할지 몰라 한참을 헤매며 이것 저것 코딩 강의라는 것을 들어봤는데 무슨 외계어를 듣는 듯 이해하기가 너무 버거워 그만둘까 생각도 했었는데, 우연히 한 유튜브 동영상에서 HTML부터 시작하는 것이 가장 쉽게 적응할 수 있다는 것을 보고난 후 시작한 것이 HTML로 웹페이지를 만들어 보는 것이었습니다. 그 후에 HTML로 시작하여 CSS,JavaScript 까지 배워가며 웹페이지를 만들면서 코딩에 재미를 좀 느끼기 시작했습니다. 그 후에 서버쪽으로 PHP 도 좀 배워보고, 데이터 베이스 SQL도 뭔지 알아보기도 하고 최근 유행이라는 Python도 열심히 공부중에 있습니다. 지금도 ..
Chapter 63. 가설 검정(Hypothesis Testing) 통계적 추론은 추론 목적에 따라 크게 추정과 가설검정으로 나눌 수 있습니다. 가설검정은 주어진 가설에 대해 데이터를 사용하여 통계적으로 검증하는 것을 의미합니다. 1. 가설의 개념과 종류 (1) 가설 검정(Hypothesis Testing)의 개념 가설 검정은 모집단의 모수 또는 분포에 대한 추측이나 주장을 설정하고 이것의 옳고 그름을 표본의 정보를 이용하여 확률적으로 판정하는 과정을 말합니다. 가설 검정은 모집단에 대한 가설을 세우고, 이를 테이터로부터 검증하는 방법입니다. 가설 검정은 귀무가설과 대립가설을 설정하고, 귀무가설이 기각되면 대립가설을 채택합니다. (2) 가설(Hypothesis)의 종류 가설이란 모수 또는 분포(모집단)에..
Chapter 62. 추정(Estimation) - 구간 추정(Interval Estimation) 통계적 추론은 추론 목적에 따라 크게 추정과 가설검정으로 나눌 수 있습니다. 추정은 표본을 통해 모집단의 모수를 추측하는 것을 의미합니다. 추정은 표본의 정보를 활용하여 모집단에 대한 정보를 얻는 데에 중요한 역할을 합니다. 추정은 점추정과 구간추정으로 나눌 수 있습니다. 구간 추정은 표본에서 계산한 통계량을 이용하여 모수가 속할 가능성이 높은 구간을 추정하는 방법입니다. 1. 구간 추정(Interval Estimation) 구간추정은 표본에서 계산한 통계량(예: 표본평균)을 이용하여 모수(예: 모평균)가 속할 가능성이 높은 구간을 추정하는 방법입니다. 일반적으로, 구간추정은 표본으로부터 계산된 점추정치(..
Chapter 61. 추정(Estimation) - 점 추정(Point Estimation) 통계적 추론은 추론 목적에 따라 크게 추정과 가설검정으로 나눌 수 있습니다. 추정은 표본을 통해 모집단의 모수를 추측하는 것을 의미합니다. 추정은 표본의 정보를 활용하여 모집단에 대한 정보를 얻는 데에 중요한 역할을 합니다. 추정은 점추정과 구간추정으로 나눌 수 있습니다. 점추정은 하나의 값으로 모수를 추정하는 것을 의미하며, 대표적으로 표본평균이나 표본분산 등이 있습니다. 1. 점 추정 점 추정이란 미지의 모수를 표본의 어떤 함수(통계량, statistic)를 이용하여 어떤 값으로 추정하는 과정입니다. 점 추정은 하나의 값으로 모수를 추정하는 것을 의미합니다. 점 추정량을 계산하는 방법에는 여러 가지가 있지만,..
Chapter 60. 통계적 추론의 개요 1. 통계적 추론(추론 통계학) 통계학의 개요에서 아래의 그림으로 통계학을 표현하였습니다. 통계적 추론 혹은 추론 통계학은 표본으로부터 모집단이 무엇인지를 추론하는 것이라 할 수 있습니다. 통계적 추론을 통하여 얻어진 모집단은 처음 표본을 추출했던 모집단과는 정확히 일치하지 않을 수 있습니다. 하지만, 통계적 추론은 모집단 II를 처음 관심을 가졌던 모집단 I과 거의 같게 만드는 과정이라고 말할 수 있습니다. 통계학을 크게 아래와 같이 분류하였습니다. 통계적 추론(추론 통계학)은 조건에 따라 아래와 같이 분류할 수 있습니다. (1) 모집단에 대한 가정 여부에 따른 분류 : 모수적 방법 vs 비모수적 방법 (2) 모수처리 방식에 따른 분류 : 빈도주의(Frequen..
Chapter 59. 카이제곱분포(Chi-square Distribution) - 연속확률분포 1. 카이제곱분포란? k개의 서로 독립적인 표준정규확률변수를 각각 제곱한 다음 합해서 얻어지는 분포입니다. k를 자유도라고 하며 카이제곱분포의 매개변수가 됩니다. 카이제곱분포는 신뢰구간이나 가설검정에서 사용합니다. 표준정규분포를 따르는 확률변수의 제곱이 자유도가 1인 카이제곱분포를 따릅니다. $$ Z^2 \sim \chi^2_1 $$ 서로 독립인 카이제곱분포의 합은 역시 카이제곱분포를 따르며 이 경우 자유도는 합치기 전 각각 확률변수의 자유도의 합과 같습니다. 2. 카이제곱분포의 확률밀도함수 카이제곱분포의 확률밀도함수는 아래와 같습니다. $$f(x;k)=\frac{1}{2^{k/2}\varGamma(k/2)}..
Chapter 58. T 분포(T-Distribution) 1. T 분포의 유래 및 원리 T-분포는 student T-분포의 줄임말로 맥주회사 기네스사에 일하던 월리엄 고셋( William Sealy Gosset )이 1908년에 제안하였는데 회사의 방침에 따라 본명을 사용할 수 없었던 고셋이 "student"라는 필명을 사용하여 제안하였습니다. 그는 작은 표본 크기에 대한 신뢰구간과 가설검정에 관한 분포를 연구하면서 T-분포를 개발했습니다. T-분포는 정규분포와 유사하지만, 표본 크기가 작을 때 발생하는 표본평균에 대한 불확실성을 더 잘 반영합니다. 특히, T-분포는 모집단이 정규분포를 따를 때, 작은 표본에서 표본평균의 분포를 나타냅니다. T-분포는 모집단의 표준편차를 알지 못할 때, 모집단이 정규분..
Chapter 57. R을 이용한 이항분포의 정규근사 이항분포는 대표적인 이산형 확률분포이지만, 표본크기가 충분히 크고 파라미터 값이 적당한 경우에는 정규분포로 근사할 수 있습니다. 이러한 근사를 사용하면, 이항분포를 다루기 어려운 경우에도 정규분포의 성질을 활용하여 다양한 추론을 수행할 수 있습니다. 1. 이항분포의 확률이 0.5에 가까울 때 이항분포 $X \sim B(100, 0.4)$ 의 그래프를 그려보면, 아래와 같습니다. n
Chapter 56. 이항분포의 정규근사 1. 이항분포의 정규근사란? 이항분포는 대표적인 이산형 확률분포이지만, 표본크기가 충분히 크고 파라미터 값이 적당한 경우에는 정규분포로 근사할 수 있습니다. 이러한 근사를 사용하면, 이항분포를 다루기 어려운 경우에도 정규분포의 성질을 활용하여 다양한 추론을 수행할 수 있습니다. 특히, 정규분포의 선형성과 대칭성, 표준화 등의 성질을 이용하면 이항분포에 대한 확률계산이 간단하고 직관적으로 이루어집니다. 이러한 이율, 이항분포의 정규근사는 통계적 추론에서 매우 중요한 역할을 합니다. 이항분포의 정규근사는 중심극한정리를 기반으로 합니다. 2. 이항분포의 정규근사 모든 이항분포가 정규근사가 가능한 것이 아니라 조건이 어느 정도 갖추어졌을 때 정규근사를 이룰 수 있습니다...
Chapter 55. R을 이용한 표집분포 & 몬테카를로 모의실험 1. 표집분포(Sampling Distribution) 표집분포는 모집단으로부터 표본을 추출했을 때, 어떤 통계량(예: 표본평균,표본분산)의 분포를 말합니다. 표집분포는 모집단으로부터 추출된 표본에서 계산된 통계량의 분포이기 때문에, 모집단에서 추출된 모든 표본에 대한 정보를 제공합니다. 이는 모집단의 모든 개체에 대한 정보를 얻기 어려운 경우에 표집분포를 사용하여 모집단을 추론하는 것이 더 효과적이기 때문입니다. 또한, 표집분포를 사용하면 모집단에 대한 가정이 필요없으며, 모집단의 분포가 무엇인지 알지 못해도 추론을 수행할 수 있습니다. 따라서, 통계적 추론에서는 표집분포를 사용하여 모집단의 특성을 추론하는 것이 일반적입니다. ◈ 예제 ..