[Level2-recsys-dkt] Wrap-up Report

멘토님 피드백

DKT 깃허브 리드미

느낀점

이슈

  1. ~~dkt lightgcn 베이스라인 argument를 기본값으로 실행했을 때, inference가 제대로 되지 않는 문제~~

  2. ~~dkt 베이스라인 inference.py 에서 기존 훈련한 모델을 사용하지 않는 문제~~

    get_model 대신 load_model 사용

  3. LSTMATT inference 문제

  4. LGBM auc, metric 파악

  5. K-fold stratified

    1. user의 마지막 sequence의 정답여부 (0,1)의 비율을 이용해서 나눈다.
    2. user의 sequence 길이를 고려해서 나눈다. (긴 애, 짧은 애)
    3. stratified 하지 않고 그냥 shuffle?
  6. cv, lb 방향성 찾기 위해 제출 방식 다양성 확인

  7. catboost wandb에 적용 https://www.kaggle.com/code/kartushovdanil/baseline-amex-catboost-blending-wandb

  8. K-fold와 wandb sweep 문제? (정확한 원인 불명)

    https://github.com/wandb/examples/tree/master/examples/wandb-sweeps/sweeps-cross-validation

2022 / 11/ 29

2022/12/2 (금) - cv alignment 개선 시키기