목차
AI 데이터 전처리
AI 모델 개발
AI 모델 학습·평가
AI 시스템 구축
최신 AI 트렌드
바로 적용 체크리스트
1) AI 데이터 전처리
1.1 데이터 편향(Data Bias)과 대응
수집
: 다양한 인구·환경에서 데이터 확보 → 사회적 다양성 보장.
불균형 해소
: 소수 클래스 추가 수집, 재샘플링.
전문가 검토
: 대표성 점검, 불필요 특성 제거.
통계 분석
: 분포/상관/누락/편향 지표(예: demographic parity, equalized odds)로 감지·보정.
레이블링
: 단일 주도 대신
다수 레이블러 + 검증 절차
로 신뢰도↑.
⚠
정정/보완
편향 감지는 단순 분포 비교만으로 부족합니다. **그룹별 성능(precision/recall/FPR/FNR)**을 함께 모니터링하세요. 배포 후엔
데이터 쉬프트
1.2 데이터 정제: 정규화 vs 표준화
정규화 (Min-max normalization)