标签: r csv processing-efficiency read.csv
我经常使用多个.csv文件,其大小为>100MB;但是,在许多情况下,我只需要一部分数据。子集始终在特定时间间隔内。我的问题是,如果R中有一个函数或方法,那么我只能加载一部分数据,而不知道时间标记的索引?
.csv
>100MB
这就是我通常的做法:
想象一下,我有一个名为.csv的{{1}}文件,我在第一列中有20年的分钟时间戳,在第二列中有数据。
Large_CSV_file.csv
第一行代码是需要花费大量时间才能加载的代码,我认为在丢弃99%的代码之前加载整个数据集并不高效...