Morning Mood 0620
오늘 아침에는
- 출근 : 7시 10분
- 어제 아침에도 잠시 스플 출근했습니다만, 갑작스러운 사정으로 강의장을 지키지 못했습니다.
- 오늘도 어김없이 아침에 나왔습니다. 6시는 무리지만 7시까지는 개운하게 나올 수 있을 듯 합니다. 그래도 출근 목표 시간은 6시로 두려고 합니다.
- 27인치 모니터가 아무래도 너무 커서 전에 사용하던 델 p2219h를 멀리 중랑구에서 다시 구해왔습니다. 역시 구관이 명관. 27인치 쓰다 보니 작아보이기도 하지만 문서작업 + 코딩에는 역시 이게 딱인듯 합니다. 7시 40분까지 자리 세팅을 마쳤습니다.
오늘 하루는
- 오늘은 제게 본격적으로 프로젝트 실행하는 첫 날입니다. 프로젝트 관리를 위한 간단한 일정을 수립하고자 합니다. 기본 아이디어는 데이콘 자동차 1주일, ICR 일주일입니다. 월요일에 결석했으므로, 토요일 반납합니다.
- 복잡하게 생각 말고, 오늘은 인강 자동차 가격 예측 보면서, 실습을 참조하여 데이콘 자동차 가격 예측에 적용합니다.
책 읽기 30분
- 제목 : <문과생, 데이터 사이언티스트 되다.>, 차현나 지음, 더퀘스트, 2020
- 읽은 범위 : 93p - 122p
- 읽은 시간 : 7:47 ~ 8:12
- 4장 : 데이터사이언티스트의 마인드 세팅
- ‘향상심’ : 데이터사이언티스트의 디폴트. “스스로 공부하며 정신없게 바쁘지 않으면서도 부지런하다” 필자가 언급하는 향상심은 내 기준에서는 ‘지적호기심’이라고 부를 수 있을 것 같다. 항상 공부하고, 변화를 쫓는 사람들. 내 주변에도 그런 사람들이 있다. 그런 이들이 언제나 나의 롤 모델이었다. 늦었지만 이제부터라도 그렇게 살고 싶었고 그것이 데싸의 자질이라면 기꺼이 따르고 싶다. “기본적으로 향상심은 부족함을 느끼는 데서 시작된다.”
- ‘호기심’ : “나 혹은 타인이 왜 불편했는지 각자의 입장을 돌아보면서 지금 문제가 무엇인지, 이 문제를 수치화할 수 있는지, 수치화할 수 있다면 개선 가능성을 데이터로 어떻게 찾아낼 수 있는지 생각하는 것. 이 모든 시작에 약간의 호기심이 필요하다.” 얼마전 미니프로젝트 12팀 남정네들과의 점심식사에서 느꼈던 점이 바로 이부분. 불편함을 감각하는 것이 불편함을 해결하려는 노력만큼이나 중요하다. 물론 감각하는 것에서 멈추면 안되겠지만. 그런 면에서 나는 불편함을 감각하는데에는 비교적 무던하다고 봐야 할 것이다. 한 편으로는 무던했던 나도, 경험이 쌓이면서 미루어 짐작하는 영역이 생기기도 했다. 따라서 무던한 감각은 조금 더 세련하고, 이를 문제해결로 이어가는 실행력을 키워야 하겠다.
- ‘사교성’ : 고객이 원하는 게 무엇인지 정확히 파악하는 능력. “ 자신만의 분석이 아닌 고객이 원하는 분석을 하기 위해서 영업 조직과 친해야 한다. 현실과 가장 맞닿아 있는 사람에게 도움을 요청해야 할 때가 반드시 있다.”
- ‘주도권’ : 수동적으로 주어진 과제를 해결하려 하기 보다는 데이터를 능동적으로 수치화하고 새로운 해석을 제시할 줄 알아야 한다. 개인적인 생각으로는 앞으로 데이터사이언티스트에게 사교성과 더불어 이 부분이 자신의 커리어를 가름하는 결정적인 능력이 될 것 같다.
- ‘경험’ : “인공지능이 모든 분석을 대신해주는 세상이 된다 해도 그 결과의 해석은 인간이 하게 될 것이다.”
- 5장 : 데이터사이언티스트의 일
- 데이터에서 가치를 찾아라 : 금광에서 금을 찾는 것처럼, 기업에게 돈을 벌어줄 수 있는, 혹은 인간을 이롭게할 수 있는 데이터를 찾아야 한다.
- 감각, 기술, 소양을 갖춰라 : 통계, 기술, 인문 세 가지 영역에서 역랑을 갖춰야 한다.
통계학 공부 30분
- 시간 : 8:22 ~ 8:52
- 동기 : 문과생 데싸되다 읽다보면 통계학 뽐뿌. 현직 비전공 데싸도 통계학의 중요성 강조(절대 변하지 않는 원리). 따라서 조금이라도 빨리 통계학 이론에 친숙해지기 위해 통계학 입문서 일독 시작한다.
- 제목 : <세상에서 가장="" 쉬운="" 통계학="" 입문="">, 고지마 히로유키 지음, 박주영 옮김, 지상사, 2009세상에서>
- 읽은 범위 : 5p ~
- 통계학이란 무엇인가? 기술통계와 추리통계
- 기술통계 : 관측으로 얻은 데이터에서 그 데이터의 특징을 뽑아내기 위한 기술. 모세 시기나 로마제국, 중국의 한나라나 일본 다이카 가이신 시대에도 인구조사나 관측이 실시되었지만, 정확한 기원은 17세기 독일 헤르만 콘링의 <국정론>, 영국 군인 존 그랜트의 <사망표에 관한="" 자연적="" 및="" 정치적="" 관찰="">, 윌리엄 페티의 <정치산술>, 에드먼드 핼리의 <사망률 추산="">. 도수분포표, 히스토그램, 평균값, 표준편차 등 사회 경제상황을 파악하거나 환경 조사에 사용한다.사망률>정치산술>사망표에>국정론>
- 추리통계 : 통계학 방법과 확률 이론을 섞은 것으로 ‘전체를 파악할 수 없을 정도의 큰 대상’이나 ‘아직 일어나지 않은, 미래에 일어날 일’에 관해 추측하는 것이다. 20세기 들어 확립된 것으로 ‘부분으로 전체를 추측한다’는 의미.