确定数字列表的分布

时间:2014-08-09 21:09:58

标签: statistics distribution

我有一个数字列表。以下是一些基本统计数据:

N > 1000
Max: 9.24
Min: 0.00955
Mean: 1.84932
Median: 0.97696

似乎数据是正确的,即许多小数字和一些非常大的数字。

我想找一个分布来概括这些数字。我认为正态分布,Gamma分布和拉普拉斯分布看起来都很可能。如何确定哪种分布最佳?

2 个答案:

答案 0 :(得分:0)

我必须说我通常以与你做的相同的方式做到这一点,通过绘制我看到它的形状的数据。 当更准确,并且仅用于正态分布时,我执行Shapiro Wilk测试以获得正常性,这至少会告诉我无效证明,这意味着无法证明日期不遵循正态分布。通常,这在科学环境中是可接受的。

我知道存在拉普拉斯和伽马分布的等效测试,尽管仍然在像this这样的新研究中。相反,有许多网站在线提供Shapiro Wilk测试,例如one

答案 1 :(得分:0)

所有正值和平均值大约是中位数的两倍,您的数据肯定是正确的。你可以排除普通和拉普拉斯,因为它们都是对称的并且可能是负的。

Wikipedia distributions page范围内找出一些很好的选择。制作数据的直方图,并检查其形状与这些分布的相似性。指数,对数法线,卡方和伽玛族都可以给出数值结果,例如您描述的结果,但不知道任何关于方差/标准偏差的信息,无论您的数据是单峰还是多模,或模式(s) )是的,我们只能猜测一大堆可能性。