为什么我需要在群集后对数据进行分类?

时间:2015-04-12 15:24:28

标签: weka data-mining

我几乎是数据挖掘的新手。我聚集了一组数据。为什么我需要分类? 例如,我的聚簇数据如下:

cluster A:
Age: 25
average: 12.5


cluster B:
age: 24
average = 14

我将数据聚集在一起预测'性':

A --> Male
B --> Female

首先,我可以得出结论,女性的平均值更高吗?如果是这样,为什么我需要使用分类?

1 个答案:

答案 0 :(得分:0)

您不需要在群集后进行分类。

你的方法对我没有意义,你的结果很可能是不正确的。

如果要计算平均年龄,请在数据的M / F子集上计算它们。 不要认为您的群集同意例如性别这通常不起作用。如果您知道所需的群集,请不要使用群集,但要使用您的课程。

群集总是会给你的结果增加不确定性。仅用它来探索数据中的结构,但从不假设聚类是正确的。哪有这回事。它是一种帮助您找到查看数据的新方法的工具,但它不能取代批判性思维和人工检查。