EDA
갯수가 적은 data는 정확히 찾아내는게 힘들 거 같다. → confidence가 낮을 것이다.
데이터 불균형 문제?
dontcare이 숙소와 식당에서 가장 많이 나오는것이 이상하다.
데이터가 적으면 데이터가 많은 value보다 상대적으로 None을 선택할 확률이 높아진다.
IDEA
Baseline code → ope Vocab DST → Generating model → None, don'tcare, ptr → ptr일때 클래스를 분류하는 model
SUMBT → ontology base DST → None도 클래스로 보고서 분류한다. → confidence 적용 가능할 것으로 보인다.
Multi-head Attention
$q^s$ : slot의 벡터
$h_t^s$ 는 뭘까? →
숙제
TRADE Paper Review 영상보고 오기
https://www.youtube.com/watch?v=nuclwoebdEM
TRADE Model 논문
TRADE.pdf