我正在查看交易响应时间(Percentile)的图表和最后10%的上涨,因此告诉我,90%应该会看到更短的响应时间。
Example
Transaction 1
Min 0.012
Avg 1.919
Max 20.935
SD 2.718
90 Percentile 6.412
许多交易看起来像这样,或多或少。为什么第90个百分点高于平均值?
答案 0 :(得分:3)
中位数是第50百分位数。它总是低于90%。如果您的数据集中有一小部分非常长,则平均值实际上可能高于第90个百分点,从而拖累整个数据集的平均值更高。
#FoundationSkills #Statistics
答案 1 :(得分:2)
第90个百分位表示90%的值低于此值。这种情况下的值是您的响应时间。因此,如果您有1000个值且第90个百分位数为n
,那么这些值中的900个将低于n
,并且仅高于n
的100个 - 因此有意义的是平均值更低比第90百分位。
答案 2 :(得分:0)
吉尔斯说: “第90个百分位表示有90%的值低于此值。在这种情况下,该值就是您的响应时间。因此,如果您有1000个值且第90个百分位是n,则其中的900个值将小于n,并且仅比n高100-因此平均值小于第90个百分位数是有道理的。” 抱歉,我看不到这有什么道理。我想说,如果您删除了最长的响应,剩下的就是较短的响应时间,因此在这种情况下,当您计算较小数字的平均值时,您将得到较小的值:90%始终小于平均,事实并非如此!
不是为了显示网站对90%的客户的效果而创造了90%的百分比?因此,收集所有最常出现的结果并消除一些罕见的极端情况(两端),这种情况很少发生吗?这可以解释为什么在loadrunner的输出中平均几乎总是小于90%。 ? 我认为这是这样的: Pic: 90% calculation
答案 3 :(得分:0)
平均值与n分位数/中位数/四分位数/百分位数完全不同。
可以设置一个均值>中位数,甚至第90个百分位数<均值的值。 他们只是不一样的东西。
查看此https://math.stackexchange.com/questions/382117/average-is-higher-than-percentile-90
人们对数据的一般假设是基于未说的假设,即数据遵循均值〜=中值的中心分布(如高斯)。
只需查看幂定律/帕累托定律,看看这个假设有多错误。 同样适用于多峰分布。 至关重要的是,在没有适当分析的情况下不要做出这样的假设,否则,这只是某种“数据废话”
(顺便说一句,这就是为什么平均收入提供的信息少于中位数收入的原因)