标签: r dplyr dbplyr
要从数据库表中采样,我经常使用该模式
library(dplyr) tbl(con, 'tableName') %>% mutate(z = random()) %>% compute() %>% arrange(z) %>% filter(row_number() < numSamples) %>% collect()
有没有一种方法可以设置种子,以便可以复制样品?