我正在使用几个大型CSV文件,这些文件足够大,我无法有效地将它们加载到内存中。
相反,我想从每个文件中读取数据样本。还有关于这个主题的其他帖子(例如Load a small random sample from a large csv file into R data frame)但我的要求有点不同,因为我想从每个文件的相同行中阅读。
将read.csv()
与skip
和nrows=1
一起使用会非常缓慢而乏味。
有没有人建议如何从多个CSV中有效地加载相同的N行而不将它们全部读入内存?