如何引导尊重主题内信息?

时间:2013-07-04 14:33:54

标签: r resampling statistics-bootstrap

这是我第一次发帖到这个论坛,我想从一开始就说我不是一个熟练的程序员。如果问题或代码不清楚,请告诉我!

我试图通过引导来获得交互的95%置信区间(CI)(这是我的测试统计)。我正在使用“boot”包。我的问题是,对于每个重新采样,我希望在受试者内进行随机化,以便来自不同受试者的观察结果不会混合。这是生成类似于我的数据帧的代码。正如你所看到的,我有两个主体内因素(“Num”和“Gram”,我对两者之间的相互作用感兴趣):

Subject = rep(c("S1","S2","S3","S4"),4)
Num     = rep(c("singular","plural"),8) 
Gram    = rep(c("gram","gram","ungram","ungram"),4)
RT      = c(657,775,678,895,887,235,645,916,930,768,890,1016,590,978,450,920)
data    = data.frame(Subject,Num,Gram,RT) 

这是我用来获取经验交互值的代码:

summary(lm(RT ~ Num*Gram, data=data))

如您所见,我的两个因素之间的相互作用是-348。我想获得这个统计信息的bootstrap置信区间,我可以使用“boot”包生成:

# You need the following packages
install.packages("car") 
install.packages("MASS")
install.packages("boot")
library("car")
library("MASS")
library("boot")

#Function to create the statistic to be boostrapped
boot.huber <- function(data, indices) {
data <- data[indices, ] #select obs. in bootstrap sample
mod <- lm(RT ~ Num*Gram, data=data)
coefficients(mod)       #return coefficient vector
}

#Generate bootstrap estimate
data.boot <- boot(data, boot.huber, 1999)

#Get confidence interval
boot.ci(data.boot, index=4, type=c("norm", "perc", "bca"),conf=0.95) #4 gets the CI for the interaction

我的问题是,我认为应该在不混合个体受试者观察的情况下生成重新采样:即,为了生成新的重新采样,来自受试者1(S1)的观察结果应该在受试者1内洗牌,而不是将其与来自受试者2等的观察...我不知道“启动”是如何进行重新取样的(我阅读了文档,但不明白该函数是如何做的)

有谁知道如何确保“启动”使用的重采样程序尊重主题级信息?

非常感谢您的帮助/建议!

1 个答案:

答案 0 :(得分:12)

只需将您的号码修改为boot()

data.boot <- boot(data, boot.huber, 1999, strata=data$Subject)

?boot提供了strata=参数的这种描述,它完全符合您的要求:

  

strata:指定层的整数向量或因子            多样本问题。这可以指定任何            模拟,但在'sim =“参数”'时被忽略。什么时候            'strata'是为非参数自举而提供的            模拟在指定的层次内完成。


附加说明:

要确认它是否正常工作,您可以调用debugonce(boot),运行上面的调用,然后单步执行调试器,直到对象i(其行包含用于重新采样的索引)已分配data行以创建每个引导程序重新取样),然后查看它。

debugonce(boot)
data.boot <- boot(data, boot.huber, 1999, strata=data$Subject)
# Browse[2]>
## [Press return 34 times]
# Browse[2]> head(i)
#      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
# [1,]    9   10   11   16    9   14   15   16    9     2    15    16     1    10
# [2,]    9   14    7   12    5    6   15    4   13     6    11    16    13     6
# [3,]    5   10   15   16    9    6    3    4    1     2    15    12     5     6
# [4,]    5   10   11    4    9    6   15   16    9    14    11    16     5     2
# [5,]    5   10    3    4    1   10   15   16    9     6     3     8    13    14
# [6,]   13   10    3   12    5   10    3    4    5    14     7    16     5    14
#      [,15] [,16]
# [1,]     7     8
# [2,]    11    16
# [3,]     3    16
# [4,]     3     8
# [5,]     7     8
# [6,]     7    12

(您可以随时输入Q离开调试器。)