我使用以下命令从read.csv.ff
包中使用ff
命令加载了大数据文件(https://www.kaggle.com/c/avazu-ctr-prediction):
train = read.csv.ffdf(file="path to my big data files/train.csv",VERBOSE=TRUE)
然后使用RStudio
的常用保存工作区保存它。它创建了两个文件:
.RData
文件和.ffData
一个压缩文件。
一切正常但每次重新启动计算机或关闭RStudio
并再次打开RStudio
时,我都无法从我的工作区访问ffdf
个对象,从而导致错误:
>train[1,]
file.access(filename, 0) == 0 is not TRUE
或者我可以在我加载的工作区中看到ffobject
。
这是什么问题?我怎么能解决它?
提前致谢, HR
答案 0 :(得分:0)
使用&fffave',然后'保存',然后' ffload'当你想再次阅读它时。所以,像:
ffsave(train,file = 'mynamedtrainfile)