我有一个n = 1000个随机变量X实现的数据集,并且是单变量的 - X = {x1, x2,...,xn}
。通过改变随机变量所依赖的参数来生成数据。例如,让r.v为圆的面积。因此,通过改变半径(保持尺寸固定 - 比如2维圆圈),我会在n
范围内为半径生成r = 5 to n
区域。
通过使用fitdist命令,我可以将分布拟合到选择正态,内核,二项式等分布的数据集。因此,数据集适合于k分布。所以,我得到k分布。如何选择最佳拟合分布,从而选择pdf?
另外,在安装之前,我是否需要在[0,1]范围内对数据进行标准化(后处理)?
答案 0 :(得分:0)
如果我理解正确,那么一旦你有一些适合的话,你就会问如何决定选择哪个发行版。
有三个主要指标(IMO)用于衡量"适合度":
选择哪个取决于很多因素;您可以随机选择一个或阅读Wiki页面,找出适合您的需求。这些测试也是MATLAB的一部分。
例如,您可以使用kstest
进行Kolmogrov-Smirnov检验。您可以向函数提供数据和假设分布,并根据KS测试评估不同的选项。