데이터 인사이트에 대한 기본 개념( https://theorydb.github.io/dev/2019/08/25/dev-ml-insight/ )
EDA 는 어떠한 방법론인가? : https://blog.naver.com/PostView.nhn?blogId=youji4ever&logNo=221484324353&parentCategoryNo=&categoryNo=10&viewDate=&isShowPopularPosts=false&from=postView
Unsupervised Learning의 종류와 도전과제, 전처리 대한 개론 (https://dev-jm.tistory.com/31)
ML 기본 개념과 왜 사용해야 하는지
인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘 기술을 개발하는 분야
기계학습 = 표현(representation) + 일반화(generalization) 이때 표현이란 데이터의 평가, 일반화란 아직 알 수 없는 데이터에 대한 처리를 의미한다.
📌여러 특징 중에서 어떤 특징을 추출할지 선택하는 것이 머신러닝 개발의 핵심📌
수많은 데이터를 학습하여 일정한 패턴을 찾아내고 그것을 활용하는 행위
계층적 군집화 : Hierarchical Clustering
차원 축소 : 고차원의 dataset을 축소(변수의 수 감소)시켜 시각화를 용이하게 함
PCA(Principle Component Analysis) : 상관성이 높은 변수들을 조합하여 새로운 변수들로 요약 및 축소.

새로운 데이터셋에 가장 많이 영향을 끼친 요소(변수)를 파악하여 PC1, PC2,...를 정의할 수 있으나 직접적인 측정은 불가하다는 것이 한계점.
주성분분석을 사용한 후, 클러스터링 기법을 적용하면 군집화의 효율을 높일 수 있음.
참고링크 : https://nittaku.tistory.com/291 :: 식습관(Feature)에 따른 체형(Label)