我有数百个带二进制值的变量,即1& 0我希望看到这些变量如何落入不同的集群?我没有看到任何python方法应用。但我可以在R中看到一个:http://arxiv.org/pdf/1112.0295.pdf
例如,我有变量(特征)a1,a2,a3,a4,.......,a100的数据。每个a都是二进制变量。我没有在观察中应用聚类,而是想在a1,a2,...,a100上应用聚类,并希望看到a1落在哪个聚类或a2落下。
有没有人知道python中类似的包或方法?我尝试在Anaconda中应用R接口,以便我可以使用R方法,但接口不起作用。
Python 3.4.3 | Anaconda 2.3.0(64位)|
答案 0 :(得分:3)
首先转置您的数据矩阵。
然后集群功能而不是实例!
答案 1 :(得分:0)
包裹scikit-learn正是您正在寻找的。 p>
它包含许多聚类算法,例如K-means
,Affinity propagation
,Mean-shift
,Spectral clustering
,Ward hierarchical clustering
,Agglomerative clustering
,{{1 },DBSCAN
等等..