Question

我有几个服务器响应延迟的测试结果。根据我们的理论分析，延迟分布应该具有重尾行为。但是，我如何证明测试结果是否遵循重尾分布？

Answer 1

我不是专家，但我认为估算延迟分布的kurtosis将是一个良好的开端。

如果你知道理论延迟分布，你也可以做goodness of fit test。

Answer 2

我认为最直接的方法是使半正态分布最合适，并观察其对尾巴的描述程度。在Python中，您可以借助scipy.stats.halfnorm.fit()进行此操作，也可以使用专门用于绘制和分析粗尾的 longtail 模块（https://github.com/Mottl/longtail）：

import numpy as np
import longtail

# generate random values from heavy tailed distribution (let's take Laplace)
X = np.random.laplace(size=10000)
X = X[X>0]  # take only right half of the distribution

# get best fit of half normal distribution to our data:
params = longtail.fit_distributions(X, distributions=['halfnorm'])

# visualize X and best fit:
longtail.plot(X, params=params)

由于尾部的点高于半正态近似值，因此给定的分布可以认为其尾部比半正态重：

如何证明实验数据遵循重尾分布？

2 个答案: