LLM 기반 맛집 추천 파이프라인의 성능을 정량적으로 검증한 결과를 정리한 문서다.
embedding vs fixed)이 의도대로 동작하는지 확인src_test, src_test2, src_test3build_llm_goldset.py, evaluate_llm.py, llm_eval_report.jsondatabase/sql/restaurant.dbfixed 20개 + embedding 30개python src_test\\\\build_llm_goldset.pypython src_test2\\\\build_llm_goldset.pypython src_test3\\\\build_llm_goldset.pypython src_test\\\\evaluate_llm.py