算法的距离度量

时间:2015-11-08 01:00:23

标签: algorithm distance theory

我目前正在开展一个项目,我需要量化算法之间的(dis)相似性 - 也就是说,我有几十个用于相同目的的算法,我想量化哪些是与其他人最接近(即更相似),并且真正“新颖”。

我的Google-Fu和我的SO-Jutsu都让我失望了,所以如果有人能说清楚,我会很感激。这样的指标是否存在?

1 个答案:

答案 0 :(得分:2)

作为一种相似性度量,您可以创建(9.121 x 4.6) + (4.6 x 2.2) + ...... etc. 数据集,稍微智能地构建,然后在所有这些数据集上运行每个算法。然后,您获得与每个算法相关联的运行时的n - 维向量,然后您可以打开任何旧距离。我想象余弦距离之类的东西是一个很好的初步猜测,因为如果您的数据集具有不同的大小,您可以按照它们缩放的方式对算法进行分类。除了运行时,您还可以监视最大内存使用量或您可以考虑的任何其他内容。