안녕하세요. 페이스북 챗봇 코리아를 운영하고 있는 우종하입니다. 최근 딥러닝의 무게 중심이 점점 자연어처리로 이동하고 있습니다. BERT가 그 시작을 알렸다면, 이제 GPT-3를 모르는 사람이 없을 정도입니다. 올해 초 OpenAI가 공개한 DALL-ECLIP 같은 흥미로운 모델들도, 기본적으로 자연어처리와 결합되어 있습니다.

말로 설명하면 사진을 생성해주는 DALL-E

말로 설명하면 사진을 생성해주는 DALL-E

사실 생각해보면 당연합니다. 우리 생활의 모든 것이 언어와 관련되어 있기 때문입니다. 매일 사람들과 나누는 대화, 새로운 소식을 알려주는 뉴스, 업무에 관련된 보고서 등 거의 모든 정보가 글자와 말로 이루어져 있습니다. 인공지능의 원천은 데이터에 있습니다. 그중 가장 많은 부분을 차지하는 텍스트를 분석하려면 자연어처리가 필수입니다. 또한 기계와 사람을 이어주는 인터페이스 역시 대화가 가장 효과적입니다. 조만간 마우스나 키보드, 터치에 이어 음성 명령이 대표적인 방식으로 자리잡을 것입니다.

자연어처리에도 분류, 감정분석, 질의응답, 기계번역 등 여러 분야가 있습니다. 하지만 그 정점에는 단연 챗봇이 존재합니다. 사람과 자연스럽게 대화를 하려면 위의 모든 기술들이 다 필요합니다. 그만큼 어려운 문제라 할 수 있습니다. 아직까지 챗봇이 성공하지 못하는 이유가 여기에 있습니다. 사용자들의 기대치는 높은데, 챗봇의 수준은 아직 예전에 비해 크게 나아지지 않았습니다.

일상대화 챗봇 이루다의 등장

그러나 올해 초 주목할 만한 변화가 일어났습니다. 바로 일상대화 챗봇 이루다입니다. 출시 2주만에 가입자가 82만명에 달했으며, 일일 활성 이용자수(DAU)는 무려 39만명이었습니다. 보통 7일 평균 리텐션이 10% 미만이란 것을 생각하면 경이적인 수치입니다. 가히 이루다 열풍이라고 부를 만큼 폭발적인 인기를 끌었습니다.

일상대화 챗봇 이루다

일상대화 챗봇 이루다

과거에도 잡담을 나누는 챗봇들은 많이 있었습니다. 그런데 이루다는 뭐가 달랐던 걸까요. 네, 여러분이 예상하시던 것처럼 바로 딥러닝이 그 주인공입니다. 지금까지는 두 문장의 유사도를 비교하는 방식으로 한 턴만 처리가 가능했습니다. 보통 대화가 이어지지 않고 뚝뚝 끊어지기 때문에 흥미가 금방 떨어졌습니다. 반면에 이루다는 딥러닝으로 여러 턴의 문맥을 고려합니다. 덕분에 화제를 계속 유지하면서 좀 더 깊은 대화를 나눌 수 있었습니다.

기존 챗봇들과 달리 이루다는 여러 턴의 문맥을 고려하여 대답

기존 챗봇들과 달리 이루다는 여러 턴의 문맥을 고려하여 대답