Excel文件中Pearson矩阵的凝聚聚类

时间:2017-03-24 10:59:52

标签: python machine-learning cluster-analysis

ELLO。希望将Python中的sklearn.cluster的凝聚聚类应用于Excel电子表格(.xlsx)

 import openpyxl
 # Get Data from Excel Spreadsheet
 data = openpyxl.load_workbook('matrix2.xlsx')

 import numpy as np
 # Pick the worksheet you want
 sheet = data.active

 # Grab Data from Spreadsheet
 X = np.array([[i.value for i in j] for j in sheet['A1': 'BT71']])
 from sklearn.cluster import AgglomerativeClustering
 ac = AgglomerativeClustering(n_clusters=12,
 affinity="pearson_affinity",
   linkage="complete")

在那之后,这一切都变得有点多了,我需要躺下来和冷法兰绒。 matrix2.xlsx是一个小型电子表格,其中一个工作表名为matrix,只有71列71行,其值介于0.0和1.0之间,正如您对Pearson所期望的那样。

Ta,非常适合任何帮助。我猜测最多12个簇的数量,因为我已经在Excel中渲染了热图 - 想要识别簇和质心,并希望做出漂亮的树状图。

1 个答案:

答案 0 :(得分:0)

如果您选择"预先计算",则AgglomerativeClustering函数需要原始输入数据或距离矩阵。

现在,你正在计算Pearson的Pearson。