일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 분산분석
- JavaScript
- html
- 글쓰기
- 회귀분석
- 에세이
- version 1
- 이항분포
- css
- 반복있음
- 인공지능
- 추정
- 이원배치 분산분석
- 변동분해
- 티스토리챌린지
- 데이터 과학
- 통계학
- 변량효과모형
- 오블완
- 고정효과모형
- 경제학
- 산점도
- 혼합효과모형
- r
- version 2
- 정규분포
- 해운업
- 반복없음
- 가설검정
- 확률
- Today
- Total
목록생각노트 (62)
생각 작업실 The atelier of thinking

42일차 세계를 잇는 다리, 해운업 "해운회사 다닌다니까 참치잡냐고 묻더라고요.""회는 많이 먹어보셨겠네요?" 해운업 종사자라면 한 번쯤 들어봤을 우스갯소리입니다. 이는 곧 해운업에 대한 낮은 인지도를 보여줍니다. 수산업의 정의조차 대부분 생소한 사람들이 해운업을 제대로 알기는 어려운 일이겠지요. 실제로 많은 사람들은 해운업과 수산업을 혼동하거나 해운업을 별로 중요하지 않은 산업으로 여기는 경향이 있습니다. 그렇다면 해운업이란 무엇일까요? 간단히 말해, 해운업은 해상에서 사람과 물건을 운송하는 산업입니다. 우리나라 해운법에 정의하기로는 " 해상여객운송사업, 해상화물운송사업, 해운중개업, 해운대리점업, 선박대여업 및 선박관리업"을 말합니다. 화물을 싣고 전 세계를 누비는 컨테이너선, 원유를 운반하는 ..
41일차정규분포를 넘어: 왜도와 첨도로 보는 현실 데이터의 모습 통계학 공부를 하다보면 낯선 용어들을 자주 만나는데 그 중에 정규분포와 함께 왜도skewness)와 첨도(kurtosis)가 있다. 통계분석에서 정규분포를 가정하는 경우가 많지만, 실제 데이터는 대칭적이지 않다. 그렇기 때문에 보다 정확한 분석을 위해서는 정규분포를 도와주는 추가적인 도구가 필요하다. 왜도는 데이터의 분포가 얼마나 비대칭인지를 측정하는 지표이다.비대팅을 나타내는 정도를 수치로 표현하여 측정하는 방법을 Karl Pearson 이란 통계학자가 고안했다고 한다. 피어슨 왜도라고도 하는데 구하는 수식은 아래와 같다. $$\sqrt{b_1}=\frac{1}{n-1}\sum_{i=1}^n \left( \frac{x_i-\bar{x}}..

40일차 영화 투모로우: 이제 더 이상 영화가 아닌 다큐멘터리 2004년, 영화 투모로우가 개봉했다. 당시 나는 얼어붙은 자유의 여신상이 인상적으로 담긴 포스터만 보고 영화관에 갔다. 영화에 대한 정보는 거의 없었지만, 영화를 보고 난 후 "온난화라는 데 웬 빙하기가 오는 것이지?" 하는 의문이 들었다. 하지만 별 생각 없이 영화상 "재난 영화 치고는 꽤 재미있네." 하는 감상으로 넘어갔다. 영화를 보고 나오던 많은 관객들의 반응도 비슷했다. 20년이 지난 지금, OTT에서 다시 투모로우를 보았다. 영화는 기후 변화로 인한 대재앙을 다룬다. 남극 대륙이 갈라지는 장면으로 시작하는 이 영화는 북극의 빙하가 녹으며 북대서양 해류가 멈추고, 극단적인 기상이변이 발생한다는 설정을 담고 있다. 주인공인 기..
39일차 월말 평가 - 2024년 11월 30일 오늘은 11월 30일 엊그제는 눈이 엄청 내렸다. 기상 관측사상 100년 만에 11월 적설량으로는 제일 많이 왔다고 한다. 9월말까지도 더웠던 탓에 가을이 왔나 싶었는데 어느새 겨울이 와버렸다. 시간은 지나고나면 빠르게 지나갔다고 느껴진다. 월말마다 한 달간을 뒤돌아보고 평가해보기로 한 이후 두번째 시간이다. 글쓰기를 해보자 하고 에세이를 쓰기 시작한 것이 두 달이 지나갔다. 11월에 대한 리뷰 11월은 혼돈과 희망이 교차했던 한 달이었다. 지난달 설정했던 목표들은 반반의 성과로 마무리 된 듯 보인다. 지난 달에 세운 11월 목표는 자료수집, 퇴고, 신문칼럼 베껴쓰기, 저널 및 에세이 일주일에 5개 쓰기였다. 목표를 달성하지 못한 부분도 있었지만, 그래..

38일차 확률 곡선 위의 세상: 평균과 분산으로 그려내 정규분포 정규분포(Normal Distribution) 란 평균, 분산, 확률은 통계학의 기초이며, 이 3가지 개념만 확실히 이해한다면 통계학의 대부분을 이해할 수 있을 것이라 말했다. 이것을 증명할 첫번째 근거가 지금부터 소개할 정규분포다. 정규분포는 평균을 중심으로 좌우 대칭(Symmetric)인 종모양(bell-shaped)의 곡선으로 봉우리가 하나(Single-peaked)라는 특징을 가지고 있다. 정규분포는 평균과 분산, 확률의 개념이 조화를 이루어 정의할 수 있다. 정규분포는 대칭형 종 모양의 분포로, 중심 위치를 결정하는 값이 평균이다. 평균은 데이터의 중심으로 나타내며, 정규분포에서는 곧 데이터가 가장 밀집된 위치를 의미한다. 평균..

37일차 확률은 혼란 속에 빛을 찾아가는 지도 우리가 사는 세상은 불확실성으로 가득 차 있다. 코로나 19는 세상 누구도 예측할 수 없었고, 어느 수험생도 대학 수학 능력 시험의 난이도를 미리 알 수는 없다. 불확실성을 없애는 것은 사실 불가능하다. 차라리 불확실성을 받아들이고 대비하는 것이 훨씬 좋은 방법이다. 불확실성을 관리하려면 먼저 측정을 할 수 있어야 한다. 이런 불확실성을 측정하는데 쓰이는 도구가 확률이다. 확률은 불확실성을 수치화 한다. 수치화를 통해 측정을 할 수 있다. 확률은 데이터 과학의 핵심이다. 데이터를 통해 사건의 확률을 구하고 이를 기반으로 준비하는 것이 불확실성을 극복하는 방법이다. 확률과 통계 확률은 통계와 함께 다닌다. 고등학교에서 배우는 "확통"과목, 즉 "확률과 통..
36일차 나름대로 열심히 쓰고 있어요. 요즘 내가 하고 있는 일이다. 글쓰기를 잘하고 싶어 나름대로 열심히 쓰고 있기는 한데, 자꾸 벽에 부딪히고 있다. 에세이 한 편 쓰기가 힘들다. 그 동안 공부했던 내용이 쓸거리로 충분할 것이라 생각했는데, 막상 이를 에세이로 쓰려고 하면 어디서 부터 시작해야 할 지 막막하다. 그래서 무엇이 문제일까 원인을 찾아보고자 을 다시 정독하며, 마음에 와 닿는 내용은 베껴 쓰기를 하며 읽고 있다. 본문 중에 "내키는 대로 쓰기만 해서는 독이 되는 글쓰기를 강화할 뿐입니다." 라는 문장은 나의 뼈를 때렸다. 난 혹시 지난 두 달간 독이 되는 글쓰기를 한 것은 아닌가 하는 생각이 들었다. 나는 돈이 되는 글쓰기를 쓰고 싶다. 그렇게 하기 위해서는 어떻게 해야 하는가에 대하여 고..

35일차 평균 너머의 진실 - 분산이 말하는 숨겨진 진실 평균과 분산 : 데이터를 이해하는 열쇠 우리가 살아가는 세상은 수많은 데이터로 이루어져 있다. 학교 시험 점수, 날씨 정보, 스포츠 기록, 심지어 소셜 미디어에서 받은 좋아요 개수까지 모두 데이터이다. 이러한 데이터를 어떻게 이해하고 활용할 수 있을까? 통계학에서는 평균과 분산이라는 두 가지 개념이 데이터를 해독하는 열쇠 역할을 한다. 데이터가 아무리 많다고 해도 적절한 처리를 하지 않은 것은 아무런 의미 없는 숫자들의 나열에 불과하다. 통계학에서 데이터 요약을 위해 실행하는 방법은 중심 위치를 찾는 것이다. 그 중 가장 흔하게 사용하는 것이 평균이다. 하지만 중심값으로 모집단의 특성을 다 나타낼 수는 없다. 데이터는 한 곳에 모여있지 않고 퍼져있..

34일차 평균의 한계 버클리대는 성차별을 했을까? 1970년대에 버클리 대학교는 때아닌 성차별 논란에 빠진 적이 있다. 논란의 발단은 대학원 입학생 중 남학생의 합격률이 여학생의 합격률보다 높게 나오면서 시작되었다. 당시 버클리 대학원 입학 데이터를 보면 남학생들의 합격률은 45%, 여학생들의 합격률은 30% 였다. 이로 인해 성차별 논란이 불거졌다. 이 합격률 차이만 본다면 버클리 대학교에서 남학생을 보다 많이 합격시킨 것으로 보인다. 하지만 학과별로 나누어 세분하여 분석한 결과는 전혀 다른 결론에 도달한다. 아래는 6개 주요 단과 대학의 성별 대학원 입학자료이다. 학과남성여성총지원자합격률총지원자합격률A82562%10882%B56063%2568%C32537%59334%D41733%37535%E19128..
33일차 지금 쓰는 글은 자료 모음입니다. 한 번에 모든 것을 완성하는 것보다 여러 번에 걸쳐 글을 완성해 보고자 합니다.다음 글은 보다 완성도가 있기를 바라면서 오늘은 떠오른 아이디어 위주로 정리해 봅니다. 을 읽고 리뷰하기 이 책은 내가 지금 하루 한 편 에세이 쓰기를 도전하는 아이디어를 제공하였다. 나는 이 책을 반복해서 읽으며 의지를 다지고 있다. 그러던 중 "한 번 읽고 평생 써먹는 책값 하는 글쓰기" 라는 글쓰기 특급기술 부분을 읽고서 시도해 보고 싶은 것이 생겼다. 그것은 "책 리뷰하기" 이다. 글쓰기의 기본은 읽기에서 시작한다고 한다. 그 읽기에서 효과적으로 기억하는 방법이 책 리뷰하기라고 한다. 그리고 아래의 8가지 질문에 답하고 그 답을 기초로 잘 엮어 쓰면 리뷰 에세이가 될 수 있다고..