我有两个磁盘框架,每个磁盘框架约有20GB的文件容量。
太大了,无法合并为数据表,因为该过程需要的内存超过了我的可用内存。我尝试使用以下代码:output <- rbindlist(list(df1, df2))
皱纹是我也想运行unique
,因为我的数据可能有重复。
我可以在两个磁盘框架上对rbindlist
使用相同的代码吗?
答案 0 :(得分:2)
是的。您只需rbindlist.disk.frame(list(df1, df2))
我也需要在某个时候实现bind_rows
!