我一直在将json文件导入r,并将其转换为列表和小标题,目的是最终生成一个整齐的版本进行分析。
创建的对象(使用fromJson)具有1639个观察值和33个变量,在我将其转换为小标题时,其中5个是嵌套数据帧。
当我第一次unnest()来展平一个嵌套的dfs时,我最终使用了大约0.5gb的内存,并且该对象增长到2,686,321个具有28个变量的观察值(一些在非嵌套过程中被丢弃) / p>
因此,当我尝试取消嵌套的最终df嵌套时,由于内存使用率猛增至6.5gb(已安装8gb)并且磁盘使用率达到100%,一切都锁定了。
显然,这些动作对我的机器来说太过分了。谁能建议一种以更资源友好的方式执行这些动作的方法?