소울메이트 찾기 기획자노트 내 FAQ를 정리하다 보니, “왜 이런 선택을 했는지”를 길게 설명할 일이 많았습니다. FAQ는 짧고 친절해야 하므로, 설계 배경과 기술적 판단은 블로그에서 투명하게 정리합니다.
소울메이트의 기획 의도 소울메이트 찾기는 서열표가 아닙니다. 목표는 “누가 더 위대한가”가 아니라 “누가 어떤 방식으로 닮았는가”를 보여주는 것입니다. 이 페이지는 엔진룸이 아니라 놀이터에 있습니다. 정확성은 지키되, 접근성과 재미를 함께 가져가는 것이 기획의 출발점입니다.
계산 방식
핵심은 두 가지 거리입니다. 지표 구성의 닮음은 코사인 거리로, 지배력 차이는 유클리드 거리로 계산합니다. 그리고 가중치 w로 두 거리를 섞어 최종 유사도를 만듭니다. 즉, 사용자는 “스타일 중심”과 “지배력 중심” 사이를 직접 움직이며 결과를 볼 수 있습니다.
기술적 고민 1: 왜 wRC+를 중심축으로 쓰지 않았나 wRC+는 매우 좋은 지표지만, 본질적으로 득점 생산력을 한 점수로 압축한 값입니다. 소울메이트의 목적은 단일 점수 비교가 아니라 스타일 유사성 비교입니다. 같은 wRC+라도 삼진, 볼넷, 장타, 인플레이 성향은 전혀 다를 수 있습니다. 그래서 wRC+를 중심축에 두면 스타일 매칭보다 성과 우열 비교로 쏠릴 위험이 컸습니다.
기술적 고민 2: 왜 통산 WAR를 중심축으로 쓰지 않았나 통산 WAR는 훌륭한 누적 가치 지표입니다. 하지만 출전량, 커리어 길이, 팀 상황의 영향이 커서 현재 선수와 과거 선수를 같은 조건으로 비교하기 어렵습니다. 동 나이대 보정 같은 방법이 가능하지만, 비교 대상이 줄고 설명이 복잡해져 놀이터의 사용 경험이 나빠집니다. 우리는 정밀한 우열 판정보다 넓은 풀에서 닮은 유형을 찾는 경험을 우선했습니다.
데이터 공개 범위와 시대 통합 KBO 공개 범위는 시대별로 데이터 밀도가 다릅니다. 고전시대와 현대야구를 같은 방식으로 완전히 통합하기 어려운 지점이 있어, 적용 가능한 공통 지표를 중심으로 설계를 고정했습니다. 없는 데이터를 있는 것처럼 꾸미지 않는 것이 원칙입니다.
우리가 선택한 원칙 첫째, 재미 둘째, 재현 가능성. 셋째, 설명 가능성. 이 세 가지를 동시에 지키는 선에서 설계를 선택했습니다.
한계와 개선 계획 현재 구조는 완벽하지 않습니다. 트래킹 데이터와 시대 통합 보정이 안정적으로 확보되면, 지표 체계를 단계적으로 확장할 예정입니다. 다만 확장은 항상 “재현 가능하고 설명 가능한가”를 먼저 통과한 뒤에만 진행합니다.