https://arxiv.org/pdf/2109.01156.pdf

last updated by soyeon kim 0506

읽게 된 배경


<aside> 💡 본 논문에서는 training question 과 novel test question 사이 성능 차이를 일으키는 challenges 에 대해 다룹니다. 이를 위해 3가지 경우- training set overlap, compositional generalization(comp-gen), novel-entity generalization(novel-entity) - 로 데이터셋을 나누어 분석했습니다. 결과적으로 novel entities 보다 compositional generalization 케이스를 더 어려워하며, ODQA의 어려움으로써 retrieval 이 잘 안됨으로써 발생하는 연쇄적 에러, question pattern의 frequency 그리고 entity frequency 가 있다고 말합니다.

</aside>

overlap? comp-gen? novel-entity?

Untitled

질문에 사용된 단어, 질문의 구조 유형을 구분 짓는 기준

overlap : there exists a paraphrase of the question in the training set.

comp-gen: all individual facts and the structure of the question has been observed across several questions in the training set – but not the given composition