纠正手动集群,使其更具相关性

时间:2018-06-08 11:59:32

标签: cluster-computing cluster-analysis clustered-index clustering-key

我有集群。它们是手动完成的。 我知道机器学习算法的目的是有效地分析配置文件,但我不会松开我拥有的集群。我只是想稍微改变它们以使它们相关。当然,结果不会像K-means输出一样好。 您是否知道现有集群中的任何方法并尝试优化/更正它们? 非常感谢

1 个答案:

答案 0 :(得分:0)

自动群集往往更糟用于所有实际目的,而不是手动标记的任何内容。

所以我认为你不需要"优化"它们。

但有一些明显的方法:

  • 对于KMeans和PAM等方法,可以使用手动群集作为初始质心。只要确保它们不会降级......
  • 存在约束聚类算法,您可以将现有标签用作约束,并使聚类算法找到最佳协议的解决方案。

但不要高估集群。它对参数,预处理,标准化,......非常敏感 - 它不可靠。