我想问为什么与使用专用大型仓库的手动群集相比,自动群集会产生较高的成本?目前,我们每月为将某些表进行自动聚类支付近100个信用,但是与此同时,我们还手动维护了所选表的聚类,而这仅花费了几个信用。
这些表之间的可比性不好,因为它们的表不同,但是我们坚信自动聚类通常更昂贵。有这种现象的解释吗?
答案 0 :(得分:2)
自动重新编组的成本与算法可以找到多少增量工作来减少深度有关,而手动重新编组则尽其所能来分配资源。
因此,在您的情况下,该算法必须发现通过重新整理才能保证性能提高,以保证重新整理工作的成本。
自动聚类的目标是“将最坏的聚类深度降低到可接受的阈值以下,以实现可预测的查询性能”,这与手动聚类不同,后者只是在给定仓库内尽可能地分组/分类。