ELLO。希望将Python中的sklearn.cluster的凝聚聚类应用于Excel电子表格(.xlsx)
import openpyxl
# Get Data from Excel Spreadsheet
data = openpyxl.load_workbook('matrix2.xlsx')
import numpy as np
# Pick the worksheet you want
sheet = data.active
# Grab Data from Spreadsheet
X = np.array([[i.value for i in j] for j in sheet['A1': 'BT71']])
from sklearn.cluster import AgglomerativeClustering
ac = AgglomerativeClustering(n_clusters=12,
affinity="pearson_affinity",
linkage="complete")
在那之后,这一切都变得有点多了,我需要躺下来和冷法兰绒。 matrix2.xlsx是一个小型电子表格,其中一个工作表名为matrix,只有71列71行,其值介于0.0和1.0之间,正如您对Pearson所期望的那样。
Ta,非常适合任何帮助。我猜测最多12个簇的数量,因为我已经在Excel中渲染了热图 - 想要识别簇和质心,并希望做出漂亮的树状图。
答案 0 :(得分:0)
如果您选择"预先计算",则AgglomerativeClustering函数需要原始输入数据或距离矩阵。
现在,你正在计算Pearson的Pearson。