比较结果

时间:2011-01-05 21:25:37

标签: statistics

假设我有两个数据集,A和B,它们包含点。现在,我通过应用一些随机点删除方法从每个数据集中获取三个数据集。现在,我总共有8个数据集。然后我在两台不同的机器X和Y上对它们运行一些计算算法,并获得以下结果:每个机器的运行时间是多长。

 datasets  |   A  |  A-1  |  A-2 |  A-3   |  B   |  B-1  | B-2  | B-3
 time
 X         |  a1  |  b1   |  c1  |   d1   |  e1  |   f1  |  g1  |  h1
 Y         |  a2  |  b2   |  c2  |   d2   |  e2  |   f2  |  g2  |  h2

现在,我怎么知道哪台机器表现更好?非常感谢!

1 个答案:

答案 0 :(得分:0)

我认为这取决于你想如何将数据集大小的变化考虑在内(假设已经删除了点的数据集较小,并且没有填充零或类似的东西)。

如果您首先假设算法为O(n),即复杂度随着项目数量线性增加,那么您可以将项目数量标准化。因此,A的标准化时间为a1/size(A)a2/size(A),依此类推。

然而,这确实假设了很多,主要假设是您对性能的评估将比较机器之间的运行时间。