1. 연구 주제명
"블랙박스 해부: LLM과 RAG의 편향성 전이 경로 추적"
(Inside the Black Box: Tracing the Neural Roots of Bias in LLM & RAG)
2. 한 줄 요약
<aside>
💡
단순 통계 분석을 넘어, 웹 데이터의 편향이 모델 내부의 어떤 뉴런과 레이어를 타고 흘러가 최종 검색(RAG) 결과까지 오염시키는지 인과적으로 규명하는 연구.
</aside>
3. 핵심 도식

4. 연구 개요 및 목표
- 배경: 지난 연구들(웹 코퍼스 C4의 정치적 편향성 통계 분석 및 데이터 편향(WSDM 2026)과 모델 출력 간의 상관관계 분석(WSDM, WWW 2026))을 통해 편향된 학습 데이터와 모델 출력의 편향성 간에 통계적으로 유의미한 상관관계가 있음을 입증했습니다.
- 문제점: 하지만 데이터의 구체적으로 어떤 특성이 모델의 내부 구조(Layer, Neuron)에 영향을 주어 편향을 형성하는지, 그리고 RAG 시스템에서 검색(Retrieval) 단계와 생성(Generation) 단계 중 어느 쪽이 편향 전이에 더 치명적인지에 대한 인과적 메커니즘은 아직 규명되지 않았습니다.
5. 목표
- 기계적 해석 가능성 기법을 도입하여, 특정 정치/사회적 편향이 모델 내부에서 형성되는 경로를 시각화하고 추적합니다.
- RAG 시스템 내에서 검색된 문서의 편향도가 최종 답변에 미치는 영향력을 정량적으로 분해하여, 효율적인 편향 완화 지점을 찾습니다
6. 연구실 선행연구
- [WSDM2026] Jaebeom You, Seung-Kyu Hong, Ling Liu, Kisung Lee, and Hyuk-Yoon Kwon*, ****"Geo-Personalization Bias in News Search: Analyzing Filter Bubbles in Search Engine Results with Multi-Perspective LLM Annotation," In Proc. The 19th ACM International Conference on Web Search and Data Mining (WSDM), Boise, Idaho, USA, Feb. 2026. TOP CONFERENCE in Web and Data Mining BK IF=3 REGULAR Acceptance rate=16.3%
- [WSDM2026] Jaebeom You, Jaewon Lee, Sehun Lee, and Hyuk-Yoon Kwon*, ****"From Data to Model in Bias: A Statistical Analysis of Political Bias in the C4 Corpus and Its Impact on LLMs," In Proc. The 19th ACM International Conference on Web Search and Data Mining (WSDM), Boise, Idaho, USA, Feb. 2026. TOP CONFERENCE in Web and Data Mining BK IF=3 REGULAR Acceptance rate=16.3%
- [CIKM2025] Jaebeom You, Seung-Kyu Hong, Ling Liu, Kisung Lee, and Hyuk-Yoon Kwon,* "FAIR-SE: Framework for Analyzing Information Disparities in Search Engines with Diverse LLM-Generated Personas," In Proc. the 34th ACM International Conference on Information and Knowledge Management (CIKM), Seoul, Korea, Nov. 2025. TOP CONFERENCE in IR and DB BK IF=3 REGULAR