처방전 라벨링
오늘의 만들다 : 처방전 라벨링
- 만들다팀에서 작업한 처방전 이미지에 넘버링된 필드 데이터를 라벨링 하는 작업을 수행
- 이미지를 그대로 타이핑 하는 작업이고, 필드 데이터 양이 많지 않아서 어렵지 않았다.
두 번째 과제 : 약품 정보를 찾아보자
- 처음에는 공공개방 데이터 중 1년치 처방 내역이 공개되어있는 것을 확인했다. 링크
- 그러나 약품 정보가 코드로 저장되어 있었다.
- ‘의약품’이라는 키워드로 공공데이터 탐색을 해보니 ‘의약품 허가정보’를 찾을 수 있었다. 링크
- 이 데이터는 API로 활용할 수 있도록 되어 있었다. API 활용에는 자신이 없었는데 선민님은 API 활용이 더 쉬울거라며 ChatGPT의 도움을 받아보라고 추천!
- 오늘은 chatGPT에게 API 활용을 가능하게 하는 requests라는 모듈이 있다는걸 배웠다. 내일 시간이 나면 이 코드를 실제로 활용하여 의약품 목록을 받을 수 있으면 좋겠다.
오늘 수업과 느낀 점, 앞으로 해야 할 것
- 거의 2주만에 수업이 논문 리뷰로 얼룩졌다. 이제는 어려움에 면역이 생겼는지 모르는건 다 스킵하고 큰 틀에서 이해하려고 노력하다 보니 큰 에너지를 쓰지는 않았다. 그렇지만 앞으로 논문을 대하는 태도가 가볍지는 않을 것 같다. 모델을 이해한다는 것이 어떤 건지 뼈저리게 느낄 수 있었다. 논문을 왜 봐야 하는지, 어떻게 봐야 하는지 조금은 엿볼 수 있었다.
- 복습을 많이 못한 채로 새로운 정보를 접하다 보니 앞에 했던 것들이 가물가물해지고, 이것이 불안으로 이어진다. 간단하게라도 앞 수업을 정리하는 시간을 만들어야 하겠다 생각했다. 하지만 우선은 매일매일 머신러닝 중급 복습부터.
- 논문을 위한 리서치를 더욱 체계적으로 해나가야 하는데, 아침 시간을 최대한 활용해서 하루 최소 2시간씩 논문을 위한 리서치를 수행해야 하겠다. 이는 과외로 진행하고 있는 기술-예술 읽기모임과 병행하여 효율성을 담보하자. (여름에는 곽영빈 세미나 필참)
- 대학원에 대한 고민들이 이어드림 DS과정 동료들에게 많은 듯. 그렇지만 나 또한 대학원 진학할 수 있는 시간적-경제적 여유는 없다. 따라서 대학원을 가지 않고도 대학원과 비슷한 효과를 낼 수 있는 스터디 등의 공동체적 대안을 찾아야겠다.
- 내 심장은 역시 자동차 앞에서 뛴다. 그것도 오래된 자동차. 어떤 방식으로 이 뛰는 심장을 더 적확한 곳에서 잘 뛰게 할지 이제는 고민을 미루어서는 안된다. 몸이 먼저 움직이는 것도 좋지만, 언어와 논리로 다른 사람에게 내가 하는 일의 당위를 공유하고 동료를 찾을 수 있어야 한다. 그런 의미에서 이번 팀플은 무조건 자동차 가격 예측!