多维层次聚类 - python

时间:2016-06-28 15:46:55

标签: python multidimensional-array cluster-analysis

那里有什么东西可以进行多维层次聚类吗?

我看过这些地方:

但到目前为止没有成功

含义:使用与2维度相同的方式查找组,但具有多个维度

一些代码:

import pandas as pd
import numpy as np
set_of_values = pd.DataFrame(
    [np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),],
     index=['temp differential', 'power differential', 'cost', 'time','output'],
    columns=range(10)).transpose()
print(set_of_values)

我想找到所有群集(' temp differential',' power differential',' power',' time& #39;,'输出&#39)。不是图形,因为它是超平面。理想情况下,输出像[所有组]:

GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'') 
...
GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e) 

给出了渐进式聚类的阈值'它可行吗?

1 个答案:

答案 0 :(得分:3)

这是一个简单的例子。在这里,这是使用分层聚类聚类4个随机变量:

%matplotlib inline
import matplotlib.pylab as plt
import seaborn as sns
import pandas as pd
import numpy as np

df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)})
sns.clustermap(df)

enter image description here

如果你关心理解树形图链接和阈值来获得聚类,那么seaborn工具会使用scipy,而this post会有所帮助。

如果你想在太空中想象这个,我建议使用主成分分析并绘制PC1与PC2 http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_iris.html