1.15 월요일
Baseline에서 모델만 LGBM으로 변경 without 피쳐 엔지니어링, 하이퍼파라미터 튜닝
RMSE: 98186.0385
1.16 화요일
김태한
- Baseline EDA 살펴보고, 강의자료의 건축년도, 구별, 동별 자료 확인.
- 구별이나 동별로 별개의 모델으로 예측한 다음 합쳐서 확인할 예정
- 결측치와 이상치는 강의 자료 보고 추가적으로 어떻게 처리할지 고민 중
- 크로스섹셔널 방법과 시계열적 방법 모두 고려
권혁찬
- 계약년월일을 활용해서 데이터를 시계열적으로 plot해서 target(부동산가격)의 추이를 확인해볼 예정
- 결측치가 있는 컬럼은 부동산 가격과 크게 연관이 없어 보인다고 판단돼서 모두 제거하고 모델링 할 예정
김소현
- ‘target’ 기준으로 EDA 진행 → 데이터의 column과 row 수가 많아 시간이 다소 소요.
- EDA를 마친 후 시계열 모델로 시도 예정
문정의