Question

我有一组整数列表（运行时间以秒为单位，因此都大于零），每组中的数量不同：

e.g.
test suite A: 12, 15, 16
test suite B: 120, 130, 125, 90, 110
test suite C: 3

我将一起运行测试套件A，B和C，我想预测需要多长时间。总结套件A，B，C的平均值给出了预期的运行时间，但没有说明我对该数字的确定程度。理想情况下，我也想要一个方差（因此也就是标准偏差）。

鉴于我想在任何此类计算中给予每个套件相等的“权重”，那么最合理的方法是什么？我见过Adding/Combining Standard Deviations，它是相似但不同的（它们不是像我一样对集合中的值求和）。

Answer 1

如果您愿意在不同测试套件的运行时间之间保持独立性，那么您可以计算将A，B和C一起运行所需的时间差异作为三者的差异总和。如果你不能独立，你将需要一些衡量他们依赖的方式。特别是，您需要三个成对的协方差。

完整的计算是

Var(A + B + C) = Var(A) + Var(B) + Var(C) + 2Cov(A,B) + 2Cov(B,C) + 2Cov(A,C)

当你假设随机变量是独立的时，你得到

Cov(A,B) = Cov(B,C) = Cov(A,C) = 0.