전부 결측치 제외해서 PCA 수행하였음

젊은 연령층(20~39) 데이터 전체에 대해 PCA 수행 - 설명력 약 47%
: 당뇨병을 가진 표본이 별로 없어서 전체에 대해 수행하였음. 플랏 아래에 분포되어 있는 표본(215, 296, ...)이 당뇨병을 가지고 있는 표본.

노인 연령층(65~)에 대해 PCA 수행 - 설명력 50.84%
: 플랏상으로는 가구 세대 구성 코드와 DE1_pr 간의 상관관계가 유의미한 것 같기도?!
DE1_pr 벡터가 가리키고 있는 방향은 주로 당뇨병 여부 - 비해당이 주로 많이 분포해있고
그 반대 방향은 1(있음)이 분포하고 있는 듯함

→ 설명력이 매우매우 낮음.. 성별, 나이, 가구 구성 등을 당뇨병 유병여부와 연관짓기에는 너무 특징이 모호해서 그런게 아닐까 싶음.. 일반 특성 변수 외에 다른 변수와도 연관지어 PCA를 수행하는 것이 좋을 것 같음
시간상 일반 특성 변수로만 했는데 주말에 좀 더 집중해서 해보겠슴다,, + R은 사실 잘 못해서 다음부터 파이썬으로 해보도록 하겟슴다,,