평가 척도 or 그래프 등이 필요
단위 테스트, 통합 테스트는 기본적으로 적용
반드시 들어가야 할 항목들(지표) 만들기
항목들 몇개가 포함되어 있는지
테스트 데이터 셋
수집하는 데이터 대비 어떤 레포트가 나와야 하는지
그럼 복잡? 일치도 판별? 어떤 요소가 들어가는지 판단해야…
전문가 대비 ~% 정도 정확도를 가지는 시스템
→ 결국 평가 데이터 셋 만들기
auto rag → 타겟 데이터 찾기(뉴스 찾기에 적용?)