在数据库非常小的情况下,聚类与监督分类

时间:2018-08-21 11:13:09

标签: machine-learning classification supervised-learning unsupervised-learning

我正在尝试根据两个类别的4个特征对受试者进行分类/聚类:健康和生病。

要知道的两件事:我知道每个主题的标签/课程+ 我只有40个主题(总共:培训+测试集!)

在这种情况下,群集或分类应该选择什么?

1 个答案:

答案 0 :(得分:1)

聚类与分类不是方法的选择,而是问题的选择。有什么问题吗?您已为数据加标签,并希望获得可以更多标签的模型-根据定义,这是分类。至于使用哪种分类的特定方法,这是一个全新的,研究驱动的问题,而不是一个简单的编程问题。特别是许多分类器会尝试将某种生成模型拟合到数据中(从而即使没有标签也可以了解结构),但最后-标签在那里,应该使用。*