<aside> 💡 [TEXTNET의 대화자원 구축 Know-how] NLP 기술의 효율적 활용을 위해서는 대화자원 구축 또한 전략적으로 수행되어야 합니다.
이를 위한 2가지 TEXTNET의 접근을 공유합니다.
</aside>
활용 엔진을 상세 분석하여 효율성을 극대화 하기 위한 전략:
언어추론 방식: 키워드, 서술어 포함 문장, 띄어쓰기, 앞 뒤 순서에 따른 추론율 산정방식 고려
'어순 변화' 카테고리에서 추론율이 낮게 유지될 경우, 대화 설계의 방향성을 우선 변화 영역으로 "깊게" 설정하여 엔진 맞춤화 코퍼스 구축을 진행합니다.
분기 처리 방법: 다양한 답변이 가능한 경우 intent를 별도 구성여부 설정
'오늘의 일정'에 대한 세부 의도(Intent)를 상·하위 관계로 그룹화 하지 않고 모두 개별적으로 구성한 경우(왼쪽), 인텐트가 분기 없이 나열됩니다. 반대로 (오른쪽) ‘오늘의 일정 알려줘’ 라는 [2단계] 예문이 나머지 예문을 의미적으로 포함하는 질문이므로 상위 분기로 설정하여 인텐트의 개수를 줄일 수 있습니다.
추론율 범위: 언어추론 방식에 따른 0~100% 구간 범위중 몇 % 이상일 경우 답변할지 설정
특정 Intent별로 구동되고 있는 Engine이 어떤 국문학적 요소에 따라 추론율이 다른지 규명하고, 이를 보완하는 방식으로 유사 발화문을 생성합니다.
의미기반 지식자원 구축 전략:
(챗봇 엔진의 경우) 단편적인 시나리오 한계 극복 전략: