使分布模型适合我的经验数据?还是只是使用数据?

时间:2019-06-26 20:26:23

标签: python simulation distribution curve-fitting data-fitting

我是模拟和分布拟合的新手。我有两个数据集(一个有4k行;另一个有300k行);这两个数据集如下:

mutex

其中a,b的值范围是21,000至800万(整数),c的值范围是0至300k(十进制),d的值是300至约100k(十进制)。

a始终大于或等于b(a> = b),c独立,b&d彼此相关(但不是线性关系)。总而言之,a&b有关系; b&d有关系。

在我的模拟中,我需要生成N行,其中Ni具有a,b,c,d值。我当时想从我拥有的数据集中取样。但是,这将不允许我使用a,b,c和d的不同组合。

另一种方法是拟合模型并进行一些优度测试。我不确定这是什么,因为我的数据需要与我猜的三个模型相符。

Index | a | b | c | d
1
2
3
..
n

我无法分别适应每一列,然后分别从每一列中取样。 完成这项工作的最佳学术方法是什么?如何在python中完成?

我希望我的问题很清楚,对不起,因为我的统计数据有限,这是我第一次处理此类示例。希望您能给我一些反馈或提示以帮助我。如果有帮助,我可以提供数字或样本。

0 个答案:

没有答案