给定样本X
我可以用scipy估计帕累托分布的参数。
X = np.random.pareto(2, 1000)
params = sp.stats.pareto.fit(X)
b, loc, scale = params
现在给出2个数据集X1
X2
我想知道哪一个更类似于帕累托分布。
考虑例如:
X1 = np.random.pareto(2, 1000)
X2 = np.random.pareto(2, 1000) + np.random.normal(0, 1, 1000)
第一种情况下的拟合应该返回较低的误差。
我该如何衡量这个错误?