我几乎是数据挖掘的新手。我聚集了一组数据。为什么我需要分类? 例如,我的聚簇数据如下:
cluster A:
Age: 25
average: 12.5
cluster B:
age: 24
average = 14
我将数据聚集在一起预测'性':
A --> Male
B --> Female
首先,我可以得出结论,女性的平均值更高吗?如果是这样,为什么我需要使用分类?
答案 0 :(得分:0)
您不需要在群集后进行分类。
你的方法对我没有意义,你的结果很可能是不正确的。
如果要计算平均年龄,请在数据的M / F子集上计算它们。 不要认为您的群集同意例如性别这通常不起作用。如果您知道所需的群集,请不要使用群集,但要使用您的课程。
群集总是会给你的结果增加不确定性。仅用它来探索数据中的结构,但从不假设聚类是正确的。哪有这回事。它是一种帮助您找到查看数据的新方法的工具,但它不能取代批判性思维和人工检查。