我无法使用非参数引导程序,因为我显然已经做了一些事情。
假设我有一个有两列(长度为n)的向量,我希望找到它们的相关性。 让我们调用这个变量数据,因此length(data [,1])等于n。
假设我想要N个样本。 我从
开始r=rep(NA,N)
r是指bootstrap样本,因为我试图估计相关系数 然后我构建一个for循环:
for(i in 1:N){
column1=sample(data[,1], n, replace=T)
column2=sample(data[,2], n, replace=T)
sample.data=data.frame(column1,column2)
r[i]=corr(sample.data)
}
我的想法是,我想单独重新采样每一列,然后在最后采用相关性,但我认为理论上这是不正确的。有些事情是错误的,因为后来的结果是行不通的。
如果有人可以请求任何帮助,我将不胜感激。
答案 0 :(得分:0)
您的逻辑问题在于您重新采样,就好像这些对是独立的,当您的假设显然不是(因为您正在尝试估算其相关性)时。 / p>
对于bootstrap,您需要重新对这些对进行重采样。
[如果您正在进行排列测试,以确保独立性与他们相关的替代方案,您可以将其视为独立的独立方式。]