3차 발표 1008

집단 2개 -> 거리 유클리디안 from sklearn.cluster import AgglomerativeClustering cluster = AgglomerativeClustering(n_clusters=2, affinity='euclidean', linkage='ward') cluster.fit_predict(data_scaled) ## 플랏팅 , 라벨링- 노랑 보라 밀크, 그뤄서리 기준 plt.figure(figsize=(10, 7)) plt.scatter(data_scaled['Milk'], data_scaled['Grocery'], c=cluster.labels_)"> 집단 2개 -> 거리 유클리디안 from sklearn.cluster import AgglomerativeClustering cluster = AgglomerativeClustering(n_clusters=2, affinity='euclidean', linkage='ward') cluster.fit_predict(data_scaled) ## 플랏팅 , 라벨링- 노랑 보라 밀크, 그뤄서리 기준 plt.figure(figsize=(10, 7)) plt.scatter(data_scaled['Milk'], data_scaled['Grocery'], c=cluster.labels_)"> 집단 2개 -> 거리 유클리디안 from sklearn.cluster import AgglomerativeClustering cluster = AgglomerativeClustering(n_clusters=2, affinity='euclidean', linkage='ward') cluster.fit_predict(data_scaled) ## 플랏팅 , 라벨링- 노랑 보라 밀크, 그뤄서리 기준 plt.figure(figsize=(10, 7)) plt.scatter(data_scaled['Milk'], data_scaled['Grocery'], c=cluster.labels_)">

## 필수 라이브러리 임포트
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

## 정규화(스케일링 0 to 1)
from sklearn.preprocessing import normalize
data_scaled = normalize(data)
data_scaled = pd.DataFrame(data_scaled, columns=data.columns)
data_scaled.head()

##덴드로그램 plotting
import scipy.cluster.hierarchy as shc
plt.figure(figsize=(10, 7))  
plt.title("Dendrograms")  
dend = shc.dendrogram(shc.linkage(data_scaled, method='ward'))

##덴드로그램 레벨 6에서 분할
plt.figure(figsize=(10, 7))  
plt.title("Dendrograms")  
dend = shc.dendrogram(shc.linkage(data_scaled, method='ward'))
plt.axhline(y=6, color='r', linestyle='--')

## 레벨 6에서 클러스터링 -> 집단 2개 -> 거리 유클리디안
from sklearn.cluster import AgglomerativeClustering
cluster = AgglomerativeClustering(n_clusters=2, affinity='euclidean', linkage='ward')  
cluster.fit_predict(data_scaled)

## 플랏팅 , 라벨링- 노랑 보라 밀크, 그뤄서리 기준
plt.figure(figsize=(10, 7))  
plt.scatter(data_scaled['Milk'], data_scaled['Grocery'], c=cluster.labels_)