在R中生成分层引导重新采样

时间:2015-07-21 08:56:32

标签: r dataframe resampling

假设我有一个包含3个变量和7行

的数据框
df <- data.frame(V1=c(0,1,0,0,0,1,0), V2=rnorm(7), V3=rnorm(7))

如何创建一个20行的自举数据帧,其中V1中的0和1的分布大致相同,即它应该包含相同数量的0和1?感谢。

我看了一些包裹,例如boot,但我不想计算自举统计数据,我只想要数据集。

1 个答案:

答案 0 :(得分:3)

您可以使用sample_n包中的dplyr

library(dplyr)
df %>% 
  group_by(V1) %>% 
  sample_n(10, replace=T)