我有一组整数列表(运行时间以秒为单位,因此都大于零),每组中的数量不同:
e.g.
test suite A: 12, 15, 16
test suite B: 120, 130, 125, 90, 110
test suite C: 3
我将一起运行测试套件A,B和C,我想预测需要多长时间。总结套件A,B,C的平均值给出了预期的运行时间,但没有说明我对该数字的确定程度。理想情况下,我也想要一个方差(因此也就是标准偏差)。
鉴于我想在任何此类计算中给予每个套件相等的“权重”,那么最合理的方法是什么?我见过Adding/Combining Standard Deviations,它是相似但不同的(它们不是像我一样对集合中的值求和)。
答案 0 :(得分:1)
如果您愿意在不同测试套件的运行时间之间保持独立性,那么您可以计算将A,B和C一起运行所需的时间差异作为三者的差异总和。如果你不能独立,你将需要一些衡量他们依赖的方式。特别是,您需要三个成对的协方差。
完整的计算是
Var(A + B + C) = Var(A) + Var(B) + Var(C) + 2Cov(A,B) + 2Cov(B,C) + 2Cov(A,C)
当你假设随机变量是独立的时,你得到
Cov(A,B) = Cov(B,C) = Cov(A,C) = 0.