我想了解负载运行程序报告的标准偏差
基于此链接(http://www.sqaforums.com/forums/hp-mercury-loadrunner/145687-response-time-standard-deviation.html?X-ANT-WAF-Attempt=1),如果平均值为4.037秒,标准差为2.31,则意味着68%的数据点位于1.727(4.037-2.31)和6.347(4.037+ 2.31)。
我的理解正确吗?或者这68%仅适用于正态分布。
我想知道值的分布,并且如果标准偏差总能给出68%数据点的响应时间范围,那么我可以将其用作响应时间的良好指示
答案 0 :(得分:1)
假设我们正在处理独立且分布均匀的随机变量X 1 ,...,X n 。然后对于每个i = 1,...,n,E [X i ] = mu和Var [X i ] = sigma 2 。因此,在您的示例中,4.037将是mu的样本估计,而1.727将是sigma的样本估计。
现在该范围(mu-sigma,mu + sigma)如何? X i 落在那的概率为F(mu + sigma)-F(mu-sigma),其中F是X i 的累积分布函数。在正态分布的情况下,确实约为0.68。在其他情况下,它肯定不必接近0.68。实际上,Chebyshev inequality几乎没有给出F(mu + sigma)-F(mu-sigma)> = 0(非信息性结果)。例如,在Gamma(2,3)情况下,概率约为0.74,而具有3个自由度的t分布的概率约为0.82。
现在有人可能会建议使用中心极限定理说0.68是任何概率分布的数字。但是,那是不对的。中心极限定理说的是平均值集中在何处以及如何集中,而不是每个观察都集中。
因此,在没有进一步假设的情况下,您不能确切地说出更多的。。 Here's该示例显示即使0%的数据也可能落入此间隔。如果有更多样本统计数据可用,则有可能获得更精确的界限。另外,由于我知道持续时间是秒,因此您可以像Gamma和Weibull一样研究distributions for such modelling。如果您愿意假设您的持续时间遵循这些分布之一,那么估计分布参数将可以给出对应于任意百分比而不是68%的范围的估计。