标签: r bigdata
可能重复: Trimming a huge (3.5 GB) csv file to read into R
R是否有透明处理不适合内存的数据的好方法?有一些用于处理大数据的软件包,但我不想在不了解实际接口的情况下决定部署大数据。
例如,我可能有一组记录,这些记录一起不适合内存。但是,如果我要加载一个子集,它由一个非常简单的数据框表示,我可以对该数据进行各种有用的选择和聚合。是否有某种包允许我将整个集合视为单个数据框并对其执行相同的操作?