通过自举的置信区间

时间:2018-08-30 20:23:15

标签: python bootstrapping

昨天,我开始阅读有关在许多情况下使用引导程序确定置信区间(CI)的信息。我目前的情况是我试图通过最大似然估计(MLE)估计模型中的三个参数。我已经完成了,现在需要定义我的配置项。很明显,这可以通过概貌可能性来完成,但是据我所知,引导程序将提供更大的CI间隔。我的问题是我不确定如何实际执行引导程序?我已经编写了自己的参数估计代码,因此没有内置的MLE计算器。

我观察到的数据基本上是二进制数据,因此为1或0。我试图从这些数据(放入具有三个参数的模型中)来估计参数值。

因此,假设我的同类群组为500,就是我从同类群组中抽取一个样本(也许是100),然后通过将样本乘以5来再次将其扩展到500,然后再次运行模拟,反过来应该会得出一些新的参数估计值,然后只需执行1000-2000次即可获得一系列参数值,然后可以使用这些参数值来定义CI?

或者我在这里想念什么吗?

1 个答案:

答案 0 :(得分:2)

这个问题与Python无关。我认为您需要阅读引导介绍。 《统计学习入门》提供了一个很好的方法。这个想法并不是要抽样100个样本-您必须抽样替换并采用相同的样本大小(500)。是的,然后您需要多次重新估计参数。然后,有几种方法可以将所有这些估计值转化为置信区间。例如,您可以使用它们来估计标准误差(采样分布的标准偏差),然后使用+/- 2 * se。