如何从ff个对象中进行随机采样

时间:2019-06-11 21:33:46

标签: r dplyr sample ff

我想从R中大型ff对象中提取1000个值。

我尝试过sample_frac包中的dplyr,但这会导致以下错误;

  

错误:tbl必须是数据帧,而不是ffdf对象

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:0)

您可以使用ffbase2软件包。它将dplyr接口添加到ff对象

install.packages("devtools")
devtools::install_github("edwindj/ffbase2")

并使用ff函数将tbl对象读取为tbl_ffdf

iris_f <- tbl_ffdf(iris)

species <- 
   iris_f %>%
   group_by(Species) %>%
   summarise(petal_width = sum(Petal.Width))