我有几个服务器响应延迟的测试结果。根据我们的理论分析,延迟分布应该具有重尾行为。但是,我如何证明测试结果是否遵循重尾分布?
答案 0 :(得分:1)
我不是专家,但我认为估算延迟分布的kurtosis将是一个良好的开端。
如果你知道理论延迟分布,你也可以做goodness of fit test。
答案 1 :(得分:1)
我认为最直接的方法是使半正态分布最合适,并观察其对尾巴的描述程度。
在Python中,您可以借助scipy.stats.halfnorm.fit()
进行此操作,也可以使用专门用于绘制和分析粗尾的 longtail 模块(https://github.com/Mottl/longtail):
import numpy as np
import longtail
# generate random values from heavy tailed distribution (let's take Laplace)
X = np.random.laplace(size=10000)
X = X[X>0] # take only right half of the distribution
# get best fit of half normal distribution to our data:
params = longtail.fit_distributions(X, distributions=['halfnorm'])
# visualize X and best fit:
longtail.plot(X, params=params)
由于尾部的点高于半正态近似值,因此给定的分布可以认为其尾部比半正态重: