标签: r io parallel-processing
我碰巧有很多文件要在R中读取和处理(~20000个文件,总共~40gb)
我在考虑对阅读进行并列化;然而,关于并行化,我想到了一个哲学问题。也许问题是错的,我的措辞不正确,因为我不是这方面的专家,所以请纠正我的错误:即使进行并行化,磁盘阅读器引脚仍然需要按顺序访问文件(只有一个读者头遍历磁盘)。我们正在并行化cpu进程,但是在任何时候机械读取都会成为CPU并行化的阻碍这一事实?将文件分成簇是否有助于读取,因为我们也试图并行化物理读取?