Question

有点困惑。我从一份报告中得到了一些Loadrunner Analysis。我是新手测试。我对第90个百分位数的理解是，鉴于它占据了第90个百分位并且省略了异常值，它呈现出更真实的图像。虽然我正在查看两个不同的报告，但两者中，第90百分位响应时间高于摘要报告中给出的平均响应时间。怎么可能呢？

我正在查看交易响应时间（Percentile）的图表和最后10％的上涨，因此告诉我，90％应该会看到更短的响应时间。

 Example
Transaction 1

Min 0.012
Avg 1.919
Max 20.935
SD 2.718
90 Percentile 6.412

许多交易看起来像这样，或多或少。为什么第90个百分点高于平均值？

Answer 1

中位数是第50百分位数。它总是低于90％。如果您的数据集中有一小部分非常长，则平均值实际上可能高于第90个百分点，从而拖累整个数据集的平均值更高。

#FoundationSkills #Statistics

Answer 2

第90个百分位表示90％的值低于此值。这种情况下的值是您的响应时间。因此，如果您有1000个值且第90个百分位数为n，那么这些值中的900个将低于n，并且仅高于n的100个 - 因此有意义的是平均值更低比第90百分位。

Answer 3

吉尔斯说： “第90个百分位表示有90％的值低于此值。在这种情况下，该值就是您的响应时间。因此，如果您有1000个值且第90个百分位是n，则其中的900个值将小于n，并且仅比n高100-因此平均值小于第90个百分位数是有道理的。” 抱歉，我看不到这有什么道理。我想说，如果您删除了最长的响应，剩下的就是较短的响应时间，因此在这种情况下，当您计算较小数字的平均值时，您将得到较小的值：90％始终小于平均，事实并非如此！

不是为了显示网站对90％的客户的效果而创造了90％的百分比？因此，收集所有最常出现的结果并消除一些罕见的极端情况（两端），这种情况很少发生吗？这可以解释为什么在loadrunner的输出中平均几乎总是小于90％。？我认为这是这样的： Pic: 90% calculation

Answer 4

平均值与n分位数/中位数/四分位数/百分位数完全不同。

可以设置一个均值>中位数，甚至第90个百分位数<均值的值。他们只是不一样的东西。

查看此https://math.stackexchange.com/questions/382117/average-is-higher-than-percentile-90

人们对数据的一般假设是基于未说的假设，即数据遵循均值〜=中值的中心分布（如高斯）。

只需查看幂定律/帕累托定律，看看这个假设有多错误。同样适用于多峰分布。至关重要的是，在没有适当分析的情况下不要做出这样的假设，否则，这只是某种“数据废话”

（顺便说一句，这就是为什么平均收入提供的信息少于中位数收入的原因）

Loadrunner分析：第90百分位数如何高于平均值？

4 个答案: