我正在尝试对大型数据集执行群集,该数据集已存储为包ffdf
中的ffbase
对象。根据{{1}}的文档(来自useR!2013会议的说明),包ffbase
为此提供了支持。
我已经查看了stream
中的函数,但我看不到如何将stream
设置为流。我认为唯一可行的功能ffdf
不起作用。我想我应该使用DSD_Wrapper
,但我不知道如何让它发挥作用。
这是一个mwe:
DSD_ReadStream
调查结构显示它是一个非常简单的对象,我可以手动重新创建它,虽然我的实际数据大小阻止了这一点。