Matlab:确定数据分布的方法有哪些

时间:2015-06-17 20:40:32

标签: matlab statistics distribution

我有一个n = 1000个随机变量X实现的数据集,并且是单变量的 - X = {x1, x2,...,xn}。通过改变随机变量所依赖的参数来生成数据。例如,让r.v为圆的面积。因此,通过改变半径(保持尺寸固定 - 比如2维圆圈),我会在n范围内为半径生成r = 5 to n区域。

通过使用fitdist命令,我可以将分布拟合到选择正态,内核,二项式等分布的数据集。因此,数据集适合于k分布。所以,我得到k分布。如何选择最佳拟合分布,从而选择pdf?

另外,在安装之前,我是否需要在[0,1]范围内对数据进行标准化(后处理)?

1 个答案:

答案 0 :(得分:0)

如果我理解正确,那么一旦你有一些适合的话,你就会问如何决定选择哪个发行版。

有三个主要指标(IMO)用于衡量"适合度":

选择哪个取决于很多因素;您可以随机选择一个或阅读Wiki页面,找出适合您的需求。这些测试也是MATLAB的一部分。

例如,您可以使用kstest进行Kolmogrov-Smirnov检验。您可以向函数提供数据和假设分布,并根据KS测试评估不同的选项。

或者,您可以通过adtest使用Anderson-Darling或通过chi2gof使用Chi-Squared。