생각 작업실 The atelier of thinking

분석 네비게이션 - PPDAC Circle 본문

생각노트

분석 네비게이션 - PPDAC Circle

knowledge-seeker 2024. 10. 3. 22:58

9일차

 

 

분석 네비게이션 - PPDAC Circle

 

 

우리가 차를 운전해서 낯선 장소를 갈 때에는 주로 네비게이션을 이용한다. 심지어 아는 곳을 갈 때에도 네비게이션을 사용하기도 한다. 집중해서 보지 않더라도 잘못된 길로 갈까 하는 불안감을 해소하기 위해서이다. 데이터분석과 통계분석을 처음 공부하는 사람은 낯선 길을 나서는 초보 운전자나 마찬가지일 것이다. 어렵지만 네비게이션을 잘 따라 가다 보면 어느새 목표 지점에 도착해 있을 것이다.

 

 

 

 

지금부터 소개할 PPDAC Circle은 데이터 분석과 통계분석의 네비게이션 역할을 하는 프레임워크(구조화된 틀)이다. PPDAC는 뉴질랜드에서 통계교육에 활용하고 있다.

 

 

 

PPDAC Circle Problem , Plan, Data, Analysis, Conclusion 5단계로 구성되어 있고, 순환적인구조를 가지고 있다. 단계의 이름으로 어떠한 작업이 필요한 유추할 있다. 문제를 인식하여 가설을 세우고(Problem), 가설을 증명하기 위한 계획을 세우고(Plan), 데이터를 수집하거나 정리하고(Data), 데이터를 분석한 (Analysis), 결론을 내는(Conclusion) 구조를 가진다. 결론이 이후에도 추가적인 분석이 필요하거나 새로운 문제가 발생했다면 다시 문제 인식(Problem) 단계로 돌아가 순환하는 구조이다. PPDAC Circle 체계적인 구성으로 분석의 효율성을 높일 있는 방법으로 통계분석을 비롯한 많은 분석이 필요한 분야에서 사용되는 방법이다.

 

단계별로 보다 구체적으로 살펴보자.

 

Problem - 문제정의

Understand & define Problem

pose investigative questions

 

시작은 통계 분석의 목적을 명확히 하는 단계이다. 출발점으로 문제를 인식하고 해결하기 위하여 어떤 가설을 세우고 검정해야 하는지 확정 짓는 단계이다. 문제 인식이나 정의 잘못되거나 가설이 엉뚱하게 설정되면 결론이 목적에 맞지 않을 가능성이 높아진다. 진행이 안될 때에는 질문을 통해서 도출하는 것도 좋다. “해결하고자 하는 문제는 무엇인가?”, “ 문제를 답하기 위해 어떤 데이터가 필요한가?” 질문을 하고 답하고 하면서 문제를 정의하고 구체화 시킬 있다.

 

Plan – 계획수립

Measures : what, why, when, where, who, how

Ethics

 

문제 해결을 위한 분석 방법을 계획하고, 필요한 데이터와 도구를 정의하는 단계이다. 여기서 연구 방법, 분석 기법, 데이터 수집 방식 등을 설계한다. "5W1H" 바탕으로 빠진 부분이 없는지 확인해보고, 윤리적인(Ethics) 측면에서 검토하는 것을 잊지 말아야 한다. 가짜뉴스, 거짓을 도와주는 행위가 되어서는 안될 것이다.

 

Data – 데이터 수집

Collect/source, manage, clean

 

문제 해결에 필요한 데이터를 수집하는 단계이다. 계획에 따라 데이터를 실제로 수집하거나, 기존 데이터를 정리 준비한다. 데이터의 정확성과 품질이 분석 결과의 신뢰성에 영향을 미치기 때문에 데이터를 어떻게 수집하고, 정제하고, 검증할 것인지가 매우 중요하다.

 

Analysis – 분석

Sort data, Make tables, graphs, summaries

Describe & reason from data, Look for pattern

 

수집한 데이터를 분석하여 패턴을 발견하고, 가설을 검정하는 단계이다. 단계에서 통계학을 통해 배운 지식들이 힘을 발휘하는 순간이다. 데이터를 분류하거나 표를 만들고 그래프를 그리는 등의 통계 기법이나 최근에는 인공지능의 머신러닝 기법을 사용하여 데이터를 처리하고 인사이트를 도출한다. 적절한 분석 방법을 사용하여 데이터를 해석하고, 문제에 대한 해답을 찾는 것이 핵심이다. 통계적 유의성 검토, 변수 관계 파악 다양한 분석 기법이 동원된다.

 

Conclusion - 결론

Answer investigative questions, Communicate findings,

Reflect and evaluate, New ideas

 

분석 결과를 바탕으로 결론을 도출하고, 해결책을 제안하거나 문제를 해결하는 단계이다. 결과를 해석하고, 문제 해결을 위한 행동 지침을 수립한다. 결론은 분석의 목적을 해결하는 방향으로 도출되어야 하며, 실질적인 조치나 의사결정으로 이어져야 한다. 단계의 마지막에는 "분석 결과가 문제를 해결하는 어떻게 기여할 있는가?", "다음 단계는 무엇인가?" 라는 질문을 해보자.

 


 

방법이 절대적인 것은 아니다. 어떠한 방법도 절대적일 없다. 다만, PPDAC Circle 장점은 분석 과정을 단계별로 체계화하여 효율성, 신뢰성, 재현성을 높인다는 것이다. 이는 분석의 정확도를 높이고, 실질적인 문제 해결로 이어지게 한다. 특히 순환적 구조 덕분에 분석이 끝난 후에도 새로운 문제를 인식하고 다시 분석을 반복할 있어, 지속적인 개선과 발전이 가능하다. 번의 분석으로 적절한 결과를 얻는 것은 극히 드문 일이다.

 

PPDAC Circle 소개한 이유는 처음 통계분석이나 데이터 분석을 하는 사람들이 어찌할 바를 모를 좋은 네비게이션 역할을 있다고 생각했기 때문이다. 그리고 통계 분석을 시작하는 이들은 잊지 마시길 " 시도해서 성공하는 것은 불가능에 가깝다" 것을. 해보고 안된다고 포기하지 말길. 네비게이션은 잘못된 길로 빠져도 다시 재검색하여 길을 찾아주듯이, 잘못된 분석이라 생각되면 다시 재설정하여 분석을 하면 된다.