什么是多目标聚类?

时间:2016-02-06 16:14:45

标签: machine-learning cluster-analysis

我不明白什么是多目标聚类是使用多个变量进行聚类还是什么? 我知道堆栈溢出可能不是这类问题的最佳选择,但是 我在其他网站上问了这个问题,但没有得到回应。

1 个答案:

答案 0 :(得分:1)

多目标优化通常意味着您有多个您感兴趣的标准,这些标准不能简单地转换为可比较的标准。例如,当您尝试使用非常快速的模型和非常准确的模型时,请考虑问题。时间以s为单位,精确度以%为单位。你如何比较(1s,90%)和(10days,92%)?哪一个更好?一般来说,没有答案。因此人们通常会做什么 - 他们寻找帕累托前线,所以你测试K模型并选择他们的M< = K,这样他们中没有一个被任何其​​他人明显“殴打”。例如,如果我们将(1s,91%)添加到前一个示例中,Pareto front将是{(1s,91%),(10days,92%)}(as(1s,90%)<(1s,91%) ),其余的是不可能比较的。)

现在您可以在群集设置中应用相同的问题。例如,假设您要构建一个快速分类新实例的模型,最小化平均值。每个集群内部的距离,并没有在每个集群中放入太多标有X的特殊实例。然后你将再次获得模型(集群),这些模型现在用3个不具有可比性的度量来衡量,并且在多目标聚类中你试图处理这些问题(比如找到这种聚类的Pareto前面)。