1. 연구 주제명

"Bias Steerability: Prompt 한 줄로 LLM 정치 편향은 얼마나 흔들리는가 — 정치 편향의 체계적 카탈로그와 robustness 정량화"

2. 한 줄 요약

<aside> 💡

사용자가 prompt 한 줄(역할극, persona 주입, system prompt override, 다국어 우회, in-context steering 등)만으로 ChatGPT·Claude·Gemini·Grok·HyperCLOVA의 정치 편향을 얼마나 자유롭게 좌·우로 흔들 수 있는가를 본 연구실의 dual external judge로 정량 측정하고, Bias Steerability Index (BSI) 라는 새로운 robustness 지표를 정의·공개한다.

</aside>

3. 핵심 도식

image.png

4. 연구 개요 및 목표

5. 실험 설계

6. 연구실 선행연구