Loadrunner分析:第90百分位数如何高于平均值?

时间:2016-11-29 20:14:14

标签: c performance-testing loadrunner percentile vugen

有点困惑。我从一份报告中得到了一些Loadrunner Analysis。我是新手测试。我对第90个百分位数的理解是,鉴于它占据了第90个百分位并且省略了异常值,它呈现出更真实的图像。虽然我正在查看两个不同的报告,但两者中,第90百分位响应时间高于摘要报告中给出的平均响应时间。怎么可能呢?

我正在查看交易响应时间(Percentile)的图表和最后10%的上涨,因此告诉我,90%应该会看到更短的响应时间。

 Example
Transaction 1

Min 0.012
Avg 1.919
Max 20.935
SD 2.718
90 Percentile 6.412

许多交易看起来像这样,或多或少。为什么第90个百分点高于平均值?

4 个答案:

答案 0 :(得分:3)

中位数是第50百分位数。它总是低于90%。如果您的数据集中有一小部分非常长,则平均值实际上可能高于第90个百分点,从而拖累整个数据集的平均值更高。

#FoundationSkills #Statistics

答案 1 :(得分:2)

第90个百分位表示90%的值低于此值。这种情况下的值是您的响应时间。因此,如果您有1000个值且第90个百分位数为n,那么这些值中的900个将低于n,并且仅高于n的100个 - 因此有意义的是平均值更低比第90百分位。

答案 2 :(得分:0)

吉尔斯说: “第90个百分位表示有90%的值低于此值。在这种情况下,该值就是您的响应时间。因此,如果您有1000个值且第90个百分位是n,则其中的900个值将小于n,并且仅比n高100-因此平均值小于第90个百分位数是有道理的。” 抱歉,我看不到这有什么道理。我想说,如果您删除了最长的响应,剩下的就是较短的响应时间,因此在这种情况下,当您计算较小数字的平均值时,您将得到较小的值:90%始终小于平均,事实并非如此!

不是为了显示网站对90%的客户的效果而创造了90%的百分比?因此,收集所有最常出现的结果并消除一些罕见的极端情况(两端),这种情况很少发生吗?这可以解释为什么在loadrunner的输出中平均几乎总是小于90%。 ? 我认为这是这样的: Pic: 90% calculation

答案 3 :(得分:0)

平均值与n分位数/中位数/四分位数/百分位数完全不同。

可以设置一个均值>中位数,甚至第90个百分位数<均值的值。 他们只是不一样的东西。

查看此https://math.stackexchange.com/questions/382117/average-is-higher-than-percentile-90

人们对数据的一般假设是基于未说的假设,即数据遵循均值〜=中值的中心分布(如高斯)。

只需查看幂定律/帕累托定律,看看这个假设有多错误。 同样适用于多峰分布。 至关重要的是,在没有适当分析的情况下不要做出这样的假设,否则,这只是某种“数据废话”

(顺便说一句,这就是为什么平均收入提供的信息少于中位数收入的原因)