我正在做一项涉及“无监督分类”的研究。 基本上我有一个trainSet,我想以无人监督的方式在X个类中聚类数据。想法类似于k-means所做的。
让我们说
步骤1) featureSet是一个[1057x10]矩阵,我想将它们聚类成88个簇。
步骤2) 使用先前计算的类来计算testData的分类方式
问题 - 可以用SVM或N-N做到吗?还要别的吗 ? - 还有其他建议吗?
答案 0 :(得分:2)
有许多聚类算法,网络充斥着关于它们和示例实现的信息。一个很好的起点是关于聚类分析的维基百科条目Cluster_analysis。
当你有一个有效的k-means实现时,你可以尝试其中一种变体来看看它们是否会产生更好的结果(k-means ++也许就像你提到的SVM一样)。如果您想要一种完全不同的方法,请查看Kohonen地图 - 也称为自组织特征地图。如果这看起来太棘手,那么简单的层次聚类将很容易实现(找到最近的两个项目,组合,冲洗和重复)。
答案 1 :(得分:1)
这听起来像是一个典型的群集问题。无论是SVM还是神经网络都无法直接解决这个问题。您可以使用dimensionality reduction的任一方法,例如将您的10维数据嵌入到二维空间中,但它们不会将数据放入群集中。
除了k-means之外,还有大量的聚类算法。如果您想要一种对比方法,您可能需要尝试agglomerative clustering算法。我不知道您使用的是哪种计算环境,但我非常喜欢R和this (very) short guide on clustering。