python中的变量聚类

时间:2015-11-10 17:48:21

标签: python-3.x cluster-analysis

我有数百个带二进制值的变量,即1& 0我希望看到这些变量如何落入不同的集群?我没有看到任何python方法应用。但我可以在R中看到一个:http://arxiv.org/pdf/1112.0295.pdf

例如,我有变量(特征)a1,a2,a3,a4,.......,a100的数据。每个a都是二进制变量。我没有在观察中应用聚类,而是想在a1,a2,...,a100上应用聚类,并希望看到a1落在哪个聚类或a2落下。

有没有人知道python中类似的包或方法?我尝试在Anaconda中应用R接口,以便我可以使用R方法,但接口不起作用。

Python 3.4.3 | Anaconda 2.3.0(64位)|

2 个答案:

答案 0 :(得分:3)

首先转置您的数据矩阵。

然后集群功能而不是实例!

答案 1 :(得分:0)

包裹scikit-learn正是您正在寻找的。

它包含许多聚类算法,例如K-meansAffinity propagationMean-shiftSpectral clusteringWard hierarchical clusteringAgglomerative clustering,{{1 },DBSCAN等等..