생각 작업실 The atelier of thinking

1. 통계학 이란 ? 본문

통계학 이야기

1. 통계학 이란 ?

knowledge-seeker 2023. 8. 1. 11:13

Chapter 1.통계학 이란 ?

 

1.  통계학의 정의

 통계학 (Statistics)의 사전적 의미로 알아보면, 

통계학은 데이터의 수집, 분석, 해석, 모델링에 관한 학문으로, 불확실성과 변동성을 다루며 이를 통한 패턴, 관계, 추이 등을 이해하고 예측하는 데 학문으로 정의할 수 있습니다.

 

통계학은 현상을 수량화하고 데이터를 분석하여 결론을 도출하며, 이를 통해 인과 관계를 파악하고 의사 결정에 기여하는 과학적인 방법론입니다. 이러한 탓에 통계학은 다양한 분야에서 활용되며, 연구, 비즈니스, 정책 결정, 의료, 사회과학 등 다양한 분야에서 신뢰할 수 있는 정보를 얻기 위해 사용됩니다.

 


2.  통계학의 활용분야

통계학은 다양한 분야에서 활용되며 중요한 역할을 합니다. 이에 따라 통계학이 필요한 이유는 다음과 같습니다.

 

(1) 데이터 분석 및 결정 지원

 

 통계학은 데이터를 수집, 분석, 해석하고 결과를 결정에 활용하는 기술입니다. 통계적 분석을 통해 데이터로부터 의미있는 정보를 추출하고, 이를 토대로 조직이나 정책 결정을 지원할 수 있습니다.

특히, 빅데이터에 대한 분석에 있어서 가장 기본적으로 사용하는 것이 통계 기법을 이용하여 분석하는 것 입니다.

 

(2) 과학연구

 

과학 연구에서 통계학은 실험 계획과 최적화를 위한 방법론을 제공합니다. 실험계획은 효율적인 실험 설계를 통해 데이터의 정보를 극대화하고 효과적인 결론을 도출하는데 도움을 줍니다. 또한 데이터를 분석하여 가설을 검증하고 결과를 해석하는 데 역할을 합니다. 이를 통해 새로운 지식을 창출할 수 있습니다.

 

 

(3) 경제학 및 비즈니스

 

경제학과 비즈니스에서는 통계학적 기법을 활용하여 시장 동향, 고객 요구사항, 제품 성능 등을 분석합니다. 이를 통해 경쟁력을 유지하고 비즈니스 전략을 수립할 수 있습니다.

 

(4) 의료 연구

 

 의료 연구에서는 통계학적 기법을 활용하여 새로운 치료 방법이나 약물의 효과를 평가합니다. 이를 통해 환자의 치료 결과를 개선하고, 의료 기술 발전에 기여할 수 있습니다. 코로나 19 백신의 임상실험에도 통계학적 기법이 활용되었습니다.

 

(5) 사회과학 및 인문학

 

 사회과학과 인문학 분야에서는 통계학적 기법을 활용하여 인간 행동이나 사회 현상을 분석합니다. 이를 통해 사회 문제를 이해하고 해결 방안을 모색할 수 있습니다.

 

따라서 통계학은 다양한 분야에서 필수적인 지식으로, 데이터 분석 및 결정 지원, 과학 연구, 경제학 및 비즈니스, 의료 연구, 사회과학 및 인문학 등에서 매우 유용한 도구 역할을 하고 있습니다.

 


3.  통계학과 데이터 과학 (Data Science)

 

 21세기에 들어서면서 정보 통신 기술의 발전과 더불어 데이터 분석이 필요한 분야는 비약적으로 증가하였습니다. 인터넷과 스마트폰, 스마트센서, GPS 등의 하드웨어 기술 뿐만 아니라, 소셜미디어, 전자상거래 시장, 웹 광고, 블록체인, IoT(사물인터넷) 등의 소프트웨어 기술이 비약적으로 발전하면서 하루에 생성되는 데이터의 양은 2조5천억 바이트 이상이라고 합니다. 

 

이에 따라 데이터 과학(Data Science)의 중요도가 점점 커지고 있는 상황입니다.

데이터 과학이란 데이터를 수집, 처리, 분석하여 유용한 정보와 인사이트를 추출하는 학문과 분야입니다.

데이터 과학은 통계학, 수학, 컴퓨터공학, 머신 러닝(Machine Learning), 알고리즘 등이 융합되어 이루어집니다. 

그 중 통계학은 데이터 과학의 핵심 개념인 데이터 분석, 추론, 예측, 실험 설계 등에 관한 원리와 이론 측면을 담당하고 있다고 할 수 있습니다.

 

출처 : Wikipedia - 데이터 사이언스

즉, 통계학은 데이터 과학의 근간이 되는 핵심 원리들을 제공하여 정확한 데이터 분석과 결정에 기여합니다. 통계학의 기법과 개념을 이해하고 활용하는 것은 데이터 과학자에게 필요한 필수적인 능력입니다. 따라서, 데이터 과학을 공부하는 사람들에게는 통계학을 꼭 숙지하고 익히는 것이 중요합니다.

 


4.  통계학과 통계프로그램

 

통계프로그램은 데이터 분석과 통계적 모델링을 수행하는 데 사용되는 다양한 소프트웨어 도구들을  말합니다.

 

통계학은 데이터를 분석하고 이해하는 분야이므로 통계프로그램을 잘 활용하면 데이터를 효과적으로 처리하고 분석할 수 있습니다. 특히 통계프로그램을 사용하여 데이터를 정리, 가공, 시각화하는 데 유용하며 통계적 모델을 구축하여 통계적 추론을 수행할 수 있습니다. 통계프로그램을 활용하면 실제 데이터에 대한 이해와 분석 능력을 향상 시킬 수 있습니다. 점점 통계학과 통계프로그램은 서로 긴밀하게 연결되어 함께 나아가는 동반자라고 할 수 있습니다.

 

대표적인 통계프로그램은 아래와 같습니다.

 

(1) R

R 은 가장 인기 있는 통계프로그램 중 하나로, 오픈 소스이며 무료로 사용할 수 있습니다.

R은 통계 및 데이터 분석에 필요한 다양한 기능과 패키지를 제공하여 데이터 처리, 시각화, 모델링, 머신러닝 등을 수행할 수 있습니다. 

 

 

 

 (2) Python

 

Python은 범용 프로그래밍 언어이지만, 데이터 과학 분야에서도 많이 사용됩니다. 통계 및 데이터 분석을 위해 Numpy, Pandas, Scikit-learn, Statsmodels 등 다양한 라이브러리를 활용할 수 있습니다.

 

 

(3) SAS

 

 SAS는 기업 및 학계에서 많이 사용되는 상용 통계프로그램입니다.

다양한 통계 기능과 데이터 관리, 데이터 마이닝, 시뮬레이션 등의 기능을 제공합니다.

 

(4) SPSS

 

SPSS는 IBM에서 개발한 통계프로그램으로, 사용자 친화적인 인터페이스와 다양한 통계 및 데이터 분석 기능을 갖추고 있습니다. 사회과학 및 경영 분야에서 널리 사용됩니다.

 

(5) Stata

 

Stata는 경제학 및 사회과학 연구에 주로 사용되는 통계 프로그램입니다.

데이터 분석, 시뮬레이션, 그래픽 등 다양한 기능을 제공합니다.

 

 (6) MATLAB

 

MATLAB은 공학 및 과학 연구에 널리 사용되는 프로그래밍 언어이며, 통계 및 데이터 분석에도 활용됩니다. MATLAB은 강력한 수치 계산 기능과 데이터 시각화 기능을 제공합니다.

 

 

 

이외에도 Excel 등 스프레드시트 프로그램은 소규모 데이터 분석과 간단한 통계분석에는 유용하게 사용할 수 있습니다.

 

'통계학 이야기' 카테고리의 다른 글

5. 자료 수집 - 통계적 실험과 관측 연구  (0) 2023.08.22
4. 통계분석과 자료 (Data)  (0) 2023.08.22
3. 통계 분석 이란 ?  (0) 2023.08.07
2. 통계학의 개요  (0) 2023.08.01
0. 들어가면서  (0) 2023.08.01