

PCA를 활용한 예측 모델에 관한 연구
: bagging과 random forest를 통하여 예측
미국 건강 통계 자료를 기반으로 PCA & K-means를 수행한 예제
: Data Cleaning, Plotting 참고
데이터셋의 진단 측정값을 기반으로 한 당뇨병 여부 예측에 관한 연구
: 데이터 셋에 포함된 특정 진단 측정을 기반으로 환자의 당뇨병 여부를 진단적으로 예측. 개별연구 주제와 가장 밀접하므로 참고 대상
Logistic Regression을 활용한 심장병 예측에 관한 연구
→ 예측 모델에는 Logistic Regression, Decision Tree, Random Forest 등이 있으며, 케글의 연구 사례를 참고하여 수차례 테스트해보면서 높은 정확도를 가진 예측 모델을 가지고 프로젝트에 적용해 볼 예정