2 분 소요

Today I Learned 2023-06-16


- 목차 -
오늘 공부한 것은 다음과 같습니다. 
1. 케글 ICR 프로젝트 코드 리뷰 
2. 머신러닝 어드밴스 퀴즈와 오답노트
3. 미니프로젝트 OT 
4. 머신러닝 배이직 복습
5. 코테 연습

학습 노트


1. 케글 ICR 프로젝트 코드 리뷰

  • 케글 링크
  • 언더샘플링과 오버샘플링 : 두 샘플링 기법은 분류 문제에서 모두 데이터가 균형잡히지 않아서 생기는 오버피핑/언더피팅을 방지하기 위해 사용하는 기법으로 두 클래스의 값의 스케일을 1:1로 맞추는 게 중심이다. 두 값 중 Major 값에 맞출지 Minor 값에 맞출지에 따라 오버샘플링, 언더샘플링이라고 한다. 보통은 언더샘플링을 훨씬 많이 쓴다. 두 값을 적절하게 조화하여 하이브리드 샘플링도 가능하다.
  • 라벨 인코더(특정 칼럼에 있는 카테고리컬 밸류를 정렬한 다음 0부터 자연수 순서대로 변환하는 method), KNN Imputer 사용을 간단하게 배움
  • VIF : 다중 공선성을 확인하는 지표. 종속변수 y를 예측하는데 영향을 줄 수 있는 feature에서, feature끼리 관련이 있을때 y 추정이 안되므로 feature끼리 선형 관계가 있는지 확인하는 지표.
  • Feature Selection via Feature Importance : Feature Importance 값을 계산하여 Feature를 Selection하는 기법. 참고
  • 수업 후에 남아서 용담쓰 코드를 다시 한 번 돌려보았따. 뭐가 뭔지 모르겠지만 돌아가게는 만들었다. 난중에 선민님이나 용담님께 또 자세히 여쭈어 볼것이다.

2. 머신러닝 어드밴스 퀴즈와 오답노트

  • 머신러닝 어드밴스 퀴즈, 아직 수업을 다 못듣기도 했어서 아얘 모르는 내용들도 많았다.
  • 문제 자체도 어려웠던 것 같다.
  • 결국 이어드림 스쿨 퀴즈 사상 최저 점수를 받았다. (10/15)
  • 방법이 없다. 절대적인 시간을 늘리고 반복한다.
  • 오답노트 링크

3. 미니프로젝트 OT

  • 미니프로젝트 10팀 (ONETEAM)에 합류하게 되었습니다. 구성원은 변웅진님, 이성준님, 유별님.
  • OT시간에는 팀끼리 모여 서로의 프로젝트에 대한 생각을 들어보고 간단한 규칙을 정했습니다. 사실상 개인 프로젝트를 진행하되 매일 한 번씩은 모여 진행상황 공유하며 티타임을 갖기로 했습니다.
  • 저는 용담님 주신 ICR 코드를 통해 머신러닝의 구조와 하이퍼 파라미터 튜닝의 기본적인 개념과 구조를 기존 수업(이상엽-김용담) 내용과 겹쳐가며 이해를 깊이 할 예정입니다.
  • 더하여 제 관심사인 중고차 시장과 연관된 데이콘 자동차 가격 예측 프로젝트를 인강 자동차 가격 예측과 함께 비교하여 진행할 예정입니다. 아마도 EDA와 선형회귀 머신러닝 모델에 대한 공부를 깊이 있게 할 수 있을 것이로 기대됩니다.

4. 머신러닝 베이직 복습

  • 오늘은 스킵. 내일과 모레 일주일 공부 복습하면서 정리 추가로 하도록 하겠습니다.

5. 코테 연습

  • 선민님 말씀하신 대로 프로그래머스 데일리 4개씩 푸는 코테 연습 아주 잠깐 했습니다.

앞으로 과제

1. 이어드림 과정

* 미니프로젝트 두번째 IC을 잘 해보자! (EDA, 머신러닝 라이브러리 사용(하이퍼 파라미터 튜닝)을 중심으로)
* 플러스 알파로 자동차 가격 측정 사이드 프로젝트로 진행 (마찬가지로)
* 무분별하게 복습하기 보다는 위 두 프로젝트를 하면서 앞 과정에서 필요한 것을 반복 학습하는 것을 전략으로
* 수학에 발목 잡혀서도 안되지만 수학을 스킵하는 것도 불가능 하므로, 저녁시간 중 1-2시간을 수학에 할애하자. 

2. 만들다

* 매일 프로그래머스 코테 4개씩

3. 기타

* 6시 출근 : 1시간 독서, 2시간 논문 리서치 
* 저녁시간 : 우선 ML 복습하고, ML 한바퀴 돌면, CS, SQL, Statics, ML-DL Mathmatics, Python 스케쥴 잡아서 예-복습
* 2주간 패턴 잡고, 패턴 잡히면 영어공부(단어, 회화 위주), 운동 등 시간을 안배할 예정
* 주말에는 평일 진도 나간거 다시 체크하고, 중요한 것 위주로 정리(코드 필사, 전개도 그리기 등)

업데이트: