假设我有一个包含3个变量和7行
的数据框df <- data.frame(V1=c(0,1,0,0,0,1,0), V2=rnorm(7), V3=rnorm(7))
如何创建一个20行的自举数据帧,其中V1中的0和1的分布大致相同,即它应该包含相同数量的0和1?感谢。
我看了一些包裹,例如boot
,但我不想计算自举统计数据,我只想要数据集。
答案 0 :(得分:3)
您可以使用sample_n
包中的dplyr
。
library(dplyr)
df %>%
group_by(V1) %>%
sample_n(10, replace=T)