생각 작업실 The atelier of thinking

통계학에서 뭘 배우나? 본문

생각노트

통계학에서 뭘 배우나?

knowledge-seeker 2024. 10. 14. 22:52

15일차

 

통계학에서 뭘 배우나?

 

통계학: 세상의 특성을 이해하는 여정 

 

 

세상에는 우리가 궁금해하는 수많은 질문들이 있다. 예를 들어, "코로나19 백신은 얼마나 효과적일까?", "다음 대통령은 누가 될까?", "신유빈 선수를 모델로 기용한 광고가 매출 증가에 기여했을까?"와 같은 문제들. 통계학은 바로 이런 관심 대상의 특성을 알아내는 도구이다. 

 

통계학에서는 이러한 궁금증을 해결하기 위해 체계적인 과정과 방법을 배운다. 모든 사람을 조사하는 것은 현실적으로 불가능하니, 모집단(전체 관심 대상)에서 표본(일부 집단)을 뽑아 그들의 특성을 분석한다. 예를 들어, 코로나 백신의 효과를 평가하려면 모든 접종자를 조사할 수 없으니 일부 접종자의 반응을 수집해 분석한다. 이때 표본의 특성을 바탕으로 모집단의 특성을 추론하는 것이 통계학의 핵심입니다. 

 

통계학은 단순히 평균, 분산 등 단순한 수치 계산을 배우는 것은 아니다. 표본을 어떻게 고를지, 데이터를 어떻게 정리하고 요약할지, 분석 결과를 어떻게 해석해 결론을 내릴지 등을 배우는 과정이다.

 

모집단과 표본 : 통계학의 출발점

 

통계학에서는 조사하고자 하는 대상 전체를 모집단이라 한다. 모집단은 관심 있는 현상이나 개체의 전체 집합을 의미하며, 그 크기가 매우 커서 모든 개체의 특성을 직접 조사하기가 쉽지 않습니다. 예를 들어, 코로나19 백신의 효능을 평가하기 위한 모집단은 코로나에 걸린 모든 사람이 될 것이고, 대통령 선거 여론조사의 모집단은 모든 유권자가 해당된다.

 

물론, 모집단 전체를 조사하는 것이 가장 정확하겠지만, 시간과 비용 측면에서 현실적이지 않은 경우가 많다. 그래서 통계학에서는 표본을 추출해 분석하는 방법을 사용한다. 표본은 모집단의 일부를 의미하며, 표본을 적절히 뽑으면 모집단의 특성을 비교적 정확하게 파악할 수 있다. 

 

중요한 점은 표본이 모집단을 대표해야 한다. 만약 편향된 표본을 선택하면 잘못된 결론을 내릴 수 있다. 통계학에서는 어떻게 하면 모집단을 잘 대표할 수 있을지에 대해 배우며, 다양한 표본 추출 방법을 익히게 된다.

결국, 통계학은 모집단과 표본의 관계를 이해하고, 적은 데이터를 가지고도 세상의 복잡한 문제에 답을 찾아가는 학문이라 할 수 있다.

 

기술 통계와 추론 통계 : 표본에서 모집단으로, 그리고 확률로 이어지는 여정

 

통계학에서는 모집단에서 추출한 표본의 특성을 수치로 표현하는 것이 중요하다. 이처럼 데이터를 분석해 얻은 수치를 통계량(Statistics)이라 부른다. 대표적인 예로 평균, 분산, 표준편차, 비율 등이 있다. 통계량을 구하는 과정은 기술 통계(Descriptive Statistics) 라고 불리며, 여기서 "기술(Descriptive)"은 데이터를 묘사하고 요약한다는 의미다.

 

우리가 흔히 통계학이라 하면 떠올리는 평균과 표준편차 같은 수치들은 모두 *기술 통계의 일부다. 하지만 통계학은 단순히 데이터를 요약하는 데서 멈추지 않는다. 최종 목표는 모집단의 특성, 즉 모수(Parameter)를 알아내는 것이다. 모집단의 특성을 정확히 파악하기 위해서는 표본에서 얻은 통계량을 기반으로 모집단에 대한 추론이 필요하다. 이처럼 통계량을 이용해 모수를 추정하는 분야가 추론 통계(Inferential Statistics). 신뢰구간 추정, 가설 검정, 회귀분석 등이 추론 통계의 대표적인 기법이다. 

 

모집단과 표본 그리고 기술통계와 추론통계 간의 관계는 아래와 같이 표현할 수 있다.

 

통계학의 과정은 크게 세 단계로 볼 수 있다. 먼저 모집단을 대표할 수 있는 표본을 추출하고, 기술 통계를 활용해 표본의 특성을 파악한 뒤, 추론 통계를 통해 모집단의 모수를 추정한다.

 

여기서 또 하나 중요한 요소가 확률이다. 확률은 사건이 발생할 가능성을 수치적으로 표현하는 도구로, 기술 통계와 추론 통계를 연결하는 핵심 개념이다. 통계량을 이용해 도출한 결론이 얼마나 신뢰할 수 있는지를 판단할 때, 확률은 필수적이다. 예측이 얼마나 정확한지, 혹은 우리가 설정한 가설이 얼마나 타당한지를 평가하는 것도 확률을 통해 이루어진다. 

결국, 확률은 불확실성을 합리적으로 측정하는 방법이며, 현대 통계학에서 거의 유일하게 사용되는 도구이다. 이러한 통계학의 여정을 통해 우리는 표본에서 시작해 모집단을 이해하고, 불확실한 세상 속에서도 합리적인 결정을 내릴 수 있는 방법을 배울 수 있다.

 


 

결론적으로, 통계학은 기술 통계, 확률, 추론 통계의 순서로 배우는 것이 일반적이다. 기술 통계는 데이터를 요약해 특성을 파악하고, 확률은 불확실성을 다루며, 추론 통계는 표본으로부터 모집단에 대한 결론을 도출한다. 이 모든 과정은 관심 대상의 특성을 정확히 파악하는 데 초점을 맞춘다.

 

따라서 통계학을 공부할 때는 단순히 수치와 공식을 외우는 것에 그치지 않고, 모집단의 본질을 이해하고 올바른 결론을 이끌어내기 위한 방법을 배운다. 통계학은 결국 데이터를 통해 더 나은 의사결정을 내리는 도구임을 잊지 말자.

'생각노트' 카테고리의 다른 글

에디터 프로그램  (4) 2024.10.16
추상화 경제학, 실험실 경제학  (1) 2024.10.15
인공지능에 접근해보기  (2) 2024.10.13
<HTML>을 아시나요?  (3) 2024.10.10
경제학, 희소성과 기회비용 그리고 선택  (9) 2024.10.08