Question

ELLO。希望将Python中的sklearn.cluster的凝聚聚类应用于Excel电子表格（.xlsx）

 import openpyxl
 # Get Data from Excel Spreadsheet
 data = openpyxl.load_workbook('matrix2.xlsx')

 import numpy as np
 # Pick the worksheet you want
 sheet = data.active

 # Grab Data from Spreadsheet
 X = np.array([[i.value for i in j] for j in sheet['A1': 'BT71']])
 from sklearn.cluster import AgglomerativeClustering
 ac = AgglomerativeClustering(n_clusters=12,
 affinity="pearson_affinity",
   linkage="complete")

在那之后，这一切都变得有点多了，我需要躺下来和冷法兰绒。 matrix2.xlsx是一个小型电子表格，其中一个工作表名为matrix，只有71列71行，其值介于0.0和1.0之间，正如您对Pearson所期望的那样。

Ta，非常适合任何帮助。我猜测最多12个簇的数量，因为我已经在Excel中渲染了热图 - 想要识别簇和质心，并希望做出漂亮的树状图。

Answer 1

如果您选择＆＃34;预先计算＆＃34;，则AgglomerativeClustering函数需要原始输入数据或距离矩阵。

现在，你正在计算Pearson的Pearson。

Excel文件中Pearson矩阵的凝聚聚类

1 个答案: