我正在尝试根据两个类别的4个特征对受试者进行分类/聚类:健康和生病。
要知道的两件事:我知道每个主题的标签/课程+ 我只有40个主题(总共:培训+测试集!)
在这种情况下,群集或分类应该选择什么?
答案 0 :(得分:1)
聚类与分类不是方法的选择,而是问题的选择。有什么问题吗?您已为数据加标签,并希望获得可以更多标签的模型-根据定义,这是分类。至于使用哪种分类的特定方法,这是一个全新的,研究驱动的问题,而不是一个简单的编程问题。特别是许多分类器会尝试将某种生成模型拟合到数据中(从而即使没有标签也可以了解结构),但最后-标签在那里,应该使用。*