생각 작업실 The atelier of thinking

데이터 문해력과 통계학, 데이터 과학 본문

생각노트

데이터 문해력과 통계학, 데이터 과학

knowledge-seeker 2024. 9. 28. 11:12

4일차

 

데이터 문해력과 통계학, 데이터 과학

 

"불편을 끼쳐 심심한 사과말씀 드립니다."
"심심한 사과? 심심해서 사과한다는 건가?"
“‘심심한 사과’라니, 난 하나도 안 심심하다”,
“사흘 간 연휴면 4일 쉬는 것인가요?”,
“고지식은 지식이 높다는 뜻?”

 

출처 : 대학신문 (https://www.snunews.com/news/articleView.html?idxno=31838)

   

    한때 온라인 카페의 사과문에 등장한심심한 사과에서심심(甚深)’마음의 표현 정도가 매우 깊고 간절하다라는 뜻이지만, ‘하는 일이 없어 지루하고 재미가 없다는 뜻의심심하다로 오인해 젊은 세대의문해력 저하논란이 생겼었다. 그 이후 문해력에 관심을 가지고 공부한 사람이 있었겠지만 아마도 지금도 현재진행형인 상황일 것 같다.

 

    이러한 문해력을 본떠서 데이터 문해력이란 말도 있다. 데이터 문해력은 말그대로 데이터를 이해하는 능력이라 정의할 수 있다. 현대 사회는 정보의 홍수시대, 빅데이터 시대라고 한다. 디지털 시대로 접어들고 난 이후 SNS, 웹사이트, 각종 포탈 등에서 하루에 생성되는 디지털 데이터 정보량 약 25억 기가바이트(GB)로  IBM에서 추산했다. 이것 조차도 2020년 기준이다.  4년이 지난 2024년 현재는 어느 정도일지 가늠이 되지도 않는다.

 

    심지어 인포데믹(infodemic) 현상도 발생한다. 인포데믹은 특정 문제에 대한 정확한 정보와 부정확한 정보가 빠르고 광범위하게 확산되는 것을 말한다. 이 단어는 정보(information)와 전염병(epidemic)의 혼성어로 잘못된 정보와 허위 정보가 어떻게 사람에서 사람으로 바이러스처럼 퍼지고 질병처럼 사람들에게 영향을 미칠 수 있는지를 설명하는 비유로 사용된다. 코로나19 대유행을 지나면서 이 단어는 널리 퍼졌다. 한마디로 가짜뉴스이다.

 

   어찌보면 지금은 데이터가 너무 많아서 문제이다. 따라서 주어진 정보를 가지고 똑바로 이해하는 능력인 데이터 문해력이 굉장히 중요해 졌다. 데이터는 수치의 모음으로, 막연히 바라보기만 해서는 무엇인지 제대로 알 수 없다. 거의 아무것도 모른다고 해도 좋다. 예를 들어 소비자의 신용카드 사용 내역 자료가 있다면, 이 자료는 통계 분석을 하기 전에는 그냥 금액의 모음일 뿐이다. 단순히 품목, 금액 등을 나열해 놓은 것에 불과하다. 하지만 여기에 데이터 과학의 통계 분석이 더해지면 얘기가 달라진다.

 

출처 : 서울파이낸스

 

  위 그래프는 직장인의 카드 사용처를 분석하여 나타난 결과다. 이에 따른 후속 조치로 카드사는 어떠한 선택을 할 수 있을까?  아마도 카드사는 직장인 대상으로 대중교통할인과 통신요금할인이 결합한 카드를 집중하여 마케팅 전략을 추진할 수 있을 것이다.

 

   

 

  사실 우리는 이미 일상 생활 속에서 데이터 과학과 함께 살고 있다. 항상 접하고 있고 사용하고 있기도 하다. 예를 들어 인터넷 쇼핑을 할 때 품목 선택을 할 때 살펴보는 것 중의 하나는 상품에 대한 댓글일 것이다. 그 이유는 상품에 대한 데이터가 맞는지 확인하는 수단일 것이다. 그 결과에 따라 올바른 선택을 하고자 함이다. 이러한 과정은 데이터 분석이며 데이터 과학이라 말할 수 있다.

 

 

 

   앞으로는 빅데이터를 넘어 메가(mega) 빅데이터 시대가 될 것 같다. 쏟아지는 데이터양이 줄어들 기미는 전혀 없다. 문해력이 가장 기본이 되는 사회 능력이듯이, 데이터 문해력 역시 미래에 아니 지금에도 기본이 되는 사회 능력일 수 있다. 데이터 문해력을 길러주는 통계학, 데이터 과학은 현대 사회를 살아가는데 갖추어야 할 선택 과목이 아니라 필수 과목인 듯 보인다.

 

통계학! 데이터 과학! 공부해 보시죠!