检索k-means和KSOM的性能

时间:2009-10-02 05:50:39

标签: performance

在k-means和KSOM(Kohonen的自组织地图)中,哪一个能提供更好的检索性能?以及如何计算这种表现?

2 个答案:

答案 0 :(得分:1)

我认为您应该更好地突出您的用法(在运行群集技术之前,在数据形状,元素数量和您可以了解数据的先验方面)。 K-means是一种非常轻便快速的算法,但有一个主要缺点:

  1. 初始化:更好的结果来自随机群集质心,因为算法本身不包含任何“局部最小值避免”规则。
  2. 群集数量:您应该事先知道要将数据映射到数据上的群集
  3. 不依赖于集群的“形状”:K-means旨在平衡空间中分区的大小,而在文献实现中,几乎没有办法(几乎)调整其他参数的流量(二阶统计量,紧凑性等措施)。
  4. 另一方面,SOM(或者你所说的KSOM)主要用于分类法或具有强大适应度的空间细分,并且可以利用比K-Means更结构化的先验。您可以选择自己的内核函数来对网络的形状和许多其他高级实践施加约束,这些实践应该比仅仅几行更值得描述。缺点:训练阶段,没有K-Means那么快,在某些领域没有用(当核函数不能很好地近似局部数据分散时)。

    希望这些可以帮到你。

答案 1 :(得分:0)

您需要精确定义您的建议用途。很可能任何两种替代方法都代表交易,对于某些用途,一种比另一种快,或者一种比另一种更精确。这对任何计算机系统来说都是挑战,发布的基准测试无法可靠地转移到特定应用程序,您经常需要使用自己的数据和使用模式进行测试。

更糟糕的是,您经常发现需求中的微小变化会对实际效果产生重大影响。

所以我担心你需要为你的特定应用程序执行自己的基准测试和测试。