Question

我无法使用非参数引导程序，因为我显然已经做了一些事情。

假设我有一个有两列（长度为n）的向量，我希望找到它们的相关性。让我们调用这个变量数据，因此length（data [，1]）等于n。

假设我想要N个样本。我从

开始

r=rep(NA,N)

r是指bootstrap样本，因为我试图估计相关系数然后我构建一个for循环：

for(i in 1:N){
column1=sample(data[,1], n, replace=T)
column2=sample(data[,2], n, replace=T)
sample.data=data.frame(column1,column2)
r[i]=corr(sample.data)
}

我的想法是，我想单独重新采样每一列，然后在最后采用相关性，但我认为理论上这是不正确的。有些事情是错误的，因为后来的结果是行不通的。

如果有人可以请求任何帮助，我将不胜感激。

Answer 1

您的逻辑问题在于您重新采样，就好像这些对是独立的，当您的假设显然不是（因为您正在尝试估算其相关性）时。 / p>

对于bootstrap，您需要重新对这些对进行重采样。

[如果您正在进行排列测试，以确保独立性与他们相关的替代方案，您可以将其视为独立的独立方式。]

双变量的非参数Bootstrap

1 个答案: