那里有什么东西可以进行多维层次聚类吗?
我看过这些地方:
但到目前为止没有成功
含义:使用与2维度相同的方式查找组,但具有多个维度
一些代码:
import pandas as pd
import numpy as np
set_of_values = pd.DataFrame(
[np.random.rand(10),
np.random.rand(10),
np.random.rand(10),
np.random.rand(10),
np.random.rand(10),],
index=['temp differential', 'power differential', 'cost', 'time','output'],
columns=range(10)).transpose()
print(set_of_values)
我想找到所有群集(' temp differential',' power differential',' power',' time& #39;,'输出&#39)。不是图形,因为它是超平面。理想情况下,输出像[所有组]:
GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'')
...
GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e)
给出了渐进式聚类的阈值'它可行吗?
答案 0 :(得分:3)
这是一个简单的例子。在这里,这是使用分层聚类聚类4个随机变量:
%matplotlib inline
import matplotlib.pylab as plt
import seaborn as sns
import pandas as pd
import numpy as np
df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)})
sns.clustermap(df)
如果你关心理解树形图链接和阈值来获得聚类,那么seaborn工具会使用scipy,而this post会有所帮助。
如果你想在太空中想象这个,我建议使用主成分分析并绘制PC1与PC2 http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_iris.html