使用k模式输出进行预测

时间:2017-10-16 14:11:36

标签: r cluster-analysis unsupervised-learning

我对历史数据的分类变量进行了k模式聚类。我做了聚类,因为我想看看数据属于哪些集群。现在我有输出,如果有新数据进入,有什么方法可以预测它将落入的集群。

可能有一种方法,因为我有每行的数据和它所属的集群,我可以将它用作列车数据并进行有监督的学习。但我想知道是否存在任何可能的方法,我可以使用现有的输出变量进行预测(半监督学习)

我可能无法共享任何数据或输出,因为我在为客户工作,但任何方法如何处理将非常有帮助。我一直在研究它已经有一段时间但是找不到合适的解决方案。

1 个答案:

答案 0 :(得分:1)

大多数聚类算法无法预测新数据。

KMeans和GMM是例外,k模式应该像k-means一样工作(找到最相似的模式)。

但通常情况下,当你使用群集时,你真的应该分析群集并仔细检查它,因为群集只是没有100%正确。通常,你会想要运行A的一些集群,一些来自运行B等的集群。无论什么都有意义。然后在经过审核的清理群集上训练分类器以进行预测。