机器学习在Python中使用n维数据进行聚类

时间:2015-03-17 06:37:40

标签: python numpy machine-learning

我正在尝试找出一个程序来对一组52维的数据进行聚类。这纯粹是为了我自己的学习,所以我有一个已知领域的数据集。数据来自retrosheet.org Gamelogs,使用世界系列数据集。我试图只使用第25-77列,所以只使用整数,忽略字符串数据。

这是我第一次尝试无监督学习,虽然我理解这些概念,但我很难在Python中实现解决方案。我一直在使用scipy和numpy。如果有人知道一个好的起点或一些解决这个问题的建议,我会很感激。

1 个答案:

答案 0 :(得分:0)

Scikit learn是在Python中进行聚类的方法。有关具有64个功能的群集的演示和代码,请参阅http://scikit-learn.org/stable/auto_examples/cluster/plot_kmeans_digits.html#example-cluster-plot-kmeans-digits-py。最好从http://scikit-learn.org/stable/tutorial/basic/tutorial.html处的教程开始,然后将您在那里学到的知识应用到数据集中,然后应用于k-means聚类。