결측치 스케일링

KCI_FI000931957.pdf

1️⃣제거하기 (Deletion) → 선택하지 않음

2️⃣채우기 (Imputation) → 선택

관측된 자료를 토대로 결측값을 대치함으로써 통계량의 표준오차가 과소 추정되는 문제가 있지만 사용하기 간단하고 효율성이 높은 평균화 기법을 사용하기로 결정!

결측치 스케일링 결과 → 일반특성 변수, 질병관련 변수까지 진행

PCA 적용 전 / 적용 후 + 예측 모델 정확도 비교

Kaggle diabetes.csv 활용