我有一个如下图所示,我想知道它是否符合帕累托分布?其累积图。 而且,我想找出x轴上标记80-20规则点的点,即x轴点,该点将地块分成20%,拥有80%的财富。
此外,我真的对scipy.stats Pareto函数感到困惑,如果有人可以对此给出一些直观的解释,那将很棒,因为文档非常混乱。
答案 0 :(得分:0)
scipy.stats.pareto从帕累托分布中随机抽取。
要知道您的分布是否符合Pareto分布,应执行Kolmogorov-Smirnov测试。
使用pareto.rvs(shape, size=1000)
从Pareto分布中抽取一个随机样本,其中shape
是您的Pareto分布的估计形状参数,并使用scipy.stats.kstest
执行测试:
pareto_smp = pareto.rvs(shape, size=1000)
D, p_value = scipy.stats.kstest(pareto_smp, values)
答案 1 :(得分:0)
没有人可以简单地确定观察数据集是否遵循特定的分布。根据您的情况,您需要什么:
使用以下方法拟合经验分布: statsmodels.ECDF
然后,将此(非参数)与您的数据进行比较,以查看是否可以拒绝零假设。
对于20/80规则: 将X重新缩放到[0,1]范围,然后在x轴上拾取0.2