假设我有两个数据集,A和B,它们包含点。现在,我通过应用一些随机点删除方法从每个数据集中获取三个数据集。现在,我总共有8个数据集。然后我在两台不同的机器X和Y上对它们运行一些计算算法,并获得以下结果:每个机器的运行时间是多长。
datasets | A | A-1 | A-2 | A-3 | B | B-1 | B-2 | B-3
time
X | a1 | b1 | c1 | d1 | e1 | f1 | g1 | h1
Y | a2 | b2 | c2 | d2 | e2 | f2 | g2 | h2
现在,我怎么知道哪台机器表现更好?非常感谢!
答案 0 :(得分:0)
我认为这取决于你想如何将数据集大小的变化考虑在内(假设已经删除了点的数据集较小,并且没有填充零或类似的东西)。
如果您首先假设算法为O(n)
,即复杂度随着项目数量线性增加,那么您可以将项目数量标准化。因此,A
的标准化时间为a1/size(A)
和a2/size(A)
,依此类推。
然而,这确实假设了很多,主要假设是您对性能的评估将比较机器之间的运行时间。