我正在处理大型二进制数据文件(> 10GB),大约需要10分钟才能使用readBin读取,但是后来我试图将其强制转换为矩阵,这可能是因为我的机器用完了记忆。当我使用python时,我会在这种情况下使用numpy.mmemap来减少我的内存占用; R有什么等价物吗?
答案 0 :(得分:1)
也许这可以帮到你:
library(ff)
library(biglm)
data <- ffm("binarydata")
您也可以只选择部分内容,以节省您的记忆:
data <- ffm("binarydata", c("col1", "clo2", "col3"))