https://arxiv.org/pdf/2109.01156.pdf
last updated by soyeon kim 0506
<aside> 💡 본 논문에서는 training question 과 novel test question 사이 성능 차이를 일으키는 challenges 에 대해 다룹니다. 이를 위해 3가지 경우- training set overlap, compositional generalization(comp-gen), novel-entity generalization(novel-entity) - 로 데이터셋을 나누어 분석했습니다. 결과적으로 novel entities 보다 compositional generalization 케이스를 더 어려워하며, ODQA의 어려움으로써 retrieval 이 잘 안됨으로써 발생하는 연쇄적 에러, question pattern의 frequency 그리고 entity frequency 가 있다고 말합니다.
</aside>
질문에 사용된 단어, 질문의 구조 유형을 구분 짓는 기준
overlap : there exists a paraphrase of the question in the training set.
comp-gen: all individual facts and the structure of the question has been observed across several questions in the training set – but not the given composition