Morning Mood 0614
오늘 아침에는
- 출근 : 6시 58분
- 지난 주 머신러닝 수업 듣지 못한 것 타격이 있으므로, 책 읽는 시간 30분, 논문 리뷰는 하지 않고 나머지 시간을 복습으로 진행하고자 합니다.
책 읽기 30분
- 제목 : <문과생, 데이터 사이언티스트 되다.>, 차현나 지음, 더퀘스트, 2020
- 읽은 범위 : 48p - 77p
- 읽은 시간 : 7:12 ~ 7:40
- 숫자와 현실의 연결 : 현실을 정의하는 데에서 데싸의 일이 시작된다. 곧, 현실에 존재하는 문장으로 된 질문을 숫자로 정의하는 것. 이를 위하 아이디어를 숫자로 확인하는 습관이 필요하다.
- 숫자와 언어 속에서 맥락을 읽어낸다 : 텍스트 마이닝과 같은 고객 행동 데이터 분석에서 긍정과 부정을 분류하는 것은 결국 인간의 몫. 왜냐면 형태소 분석으로 분리된 단어도 맥락 속에서 긍정과 부정이 판별되기 때문. “데이터 사이언티스트는 고정된 역할만 하지 않는다. 데이터에서 가치를 찾고 기업에 도움이 되는 일이라면 무엇이든 해낸다. 결국 데이터 사이언티스트가 될 수 있는 왕도는 따로 없는 셈이다.”
-
2부 기술보다 먼저 익혀야 할 것들 : 데이터 사이언티스트의 역량 -
3장 문과생 데이터 사이언티스트의 기초 체력 다지기 - 데싸의 본질 = 데이터를 분석하고 인사이트를 찾고 전달하는 일
- 코딩도 영어처럼, 활용과 목적이 있어야 더 빠르게 배울 수 있다. 데이터 구조와 결과물을 명확하게 이해해야 언어와 툴을 빠르게 학습할 수 있다.
- 통계 공부에서도 모델 자체에 집중하기 보다는 그 모델을 어떤 프로젝트에 사용해야 하는지 먼저 파악하는 게 중요하다.
- 주어진 조건에서 필요한 것을 중심으로 먼저 배워라.
- 통계 관련 수업은 최대한 많이 들어라 : 어려워도 포기하지 말고 익숙해지도록 하자. 생활에서 분석과 정의가 습관이 되도록.
- 수학도, 기술에 대한 이해도 필요하지만, 점점 기술을 통해 해결할 수 있으므로 오히려 문제를 어떻게 해결할지, 상황을 정리하는 힘을 갖는게 중요해질 것이다.
-
- 막간 책읽기 : 라운지에 있는 코스모폴리탄 출판 90년대생 여성 창업가에 대한 책을 살짝 읽어봤는데 매우 두근두근한 내용이니까 빨리 문과생 떼고 읽어야지.
머신러닝 어드밴스 복습
- 시간 : 8:00 ~ 8:50
- 내용 : 5/30일분 sklearn 실습을 진행함. 5/31분 Linear Regression 선형회귀모형의 Gradient Descent Algorithm 수학적 증명에 대해 간단히 복습. (21분까지 봄.)