🧩 문제 배경

이번 팀 프로젝트로 초성 퀴즈 게임을 만들기로 했다.

게임의 기본적인 흐름은 이렇다.

<aside> 💡

랜덤한 2글자 초성이 주어지면,

유저는 제한 시간 내에 가능한 많은 단어를 입력한다.

입력된 단어에 대해 다음과 같은 처리가 필요하다 ➡️

게임 매커니즘 자체는 간단하다.

그런데 고민이 시작된 지점은 다음과 같았다.

이번 글에서는

유저가 입력한 단어가 실제 존재하는 단어인지 판단하는 문제에 대해 내가 어떤 방법을 고민했고, 어떤 시도들을 했는지를 정리하려 한다.


🗂 데이터 확보: 우리말샘 JSON

해당 초성 퀴즈는 우리가 만들 서비스의 일부에 불과하므로, 라이브러리나 오픈 API를 적극 활용해서 개발 시간을 아끼는 것이 우선이었다.

GPT에 물어보니 한국어 단어는 보통 50만 개에서 100만 개 정도 된다고 한다…

한국어는 워낙 신조어도 많고, 단어 수도 방대하니까…

처음엔 한국어 단어를 제공하는 공공기관 API를 찾아보았다.