我很抱歉,如果这对某些人来说非常明显,但是我一直试图让我的脑袋绕过几个小时,而对于一些如此简单的事情,我真的很挣扎。
我有一个大的数据集,但它不是正常分布的,我试图找到置信水平,因此我为什么转向bootstraps。我想将引导程序应用到数据集的第四列,我可以这样做。
但是我在使用bootci函数时遇到了麻烦
ci=bootci(10000, ..... , array;
我无法实现该功能,因为我不完全理解bootci功能的第二部分,表示为.....。
我已经看到@mean在其他示例中实现了,我假设这会计算每列的均值并将其应用于函数。
如果有人能够证实我的想法或向我解释这个功能,那将非常感激!
我也不确定如何更改样本量,有人能指出我正确的方向吗?
答案 0 :(得分:1)
根据我对这个问题的理解:
ci = bootci(10000, @mean, X);
使用从数据集X
替换的随机抽样生成的10000个子样本,确定数据集X
均值的95%置信区间。
函数@mean
的第二个参数表示应用于子样本的函数是mean
,因此计算均值的置信区间。如果您愿意,您可以同样传入@std
来计算标准差的置信区间,或者传递任何其他合适的函数。
根据我在documentation中所读到的内容,似乎无法直接控制bootci
函数使用的子样本的大小。