可提供无监督的分类方法

时间:2009-11-18 10:00:19

标签: machine-learning svm

我正在做一项涉及“无监督分类”的研究。 基本上我有一个trainSet,我想以无人监督的方式在X个类中聚类数据。想法类似于k-means所做的。

让我们说

步骤1) featureSet是一个[1057x10]矩阵,我想将它们聚类成88个簇。

步骤2) 使用先前计算的类来计算testData的分类方式

问题 - 可以用SVM或N-N做到吗?还要别的吗 ? - 还有其他建议吗?

2 个答案:

答案 0 :(得分:2)

有许多聚类算法,网络充斥着关于它们和示例实现的信息。一个很好的起点是关于聚类分析的维基百科条目Cluster_analysis

当你有一个有效的k-means实现时,你可以尝试其中一种变体来看看它们是否会产生更好的结果(k-means ++也许就像你提到的SVM一样)。如果您想要一种完全不同的方法,请查看Kohonen地图 - 也称为自组织特征地图。如果这看起来太棘手,那么简单的层次聚类将很容易实现(找到最近的两个项目,组合,冲洗和重复)。

答案 1 :(得分:1)

这听起来像是一个典型的群集问题。无论是SVM还是神经网络都无法直接解决这个问题。您可以使用dimensionality reduction的任一方法,例如将您的10维数据嵌入到二维空间中,但它们不会将数据放入群集中。

除了k-means之外,还有大量的聚类算法。如果您想要一种对比方法,您可能需要尝试agglomerative clustering算法。我不知道您使用的是哪种计算环境,但我非常喜欢Rthis (very) short guide on clustering