Hi Stackoverflow社区,
我的csv文件很大,基本上太大了,无法放入计算机内存。因此,我只想从csv文件中读取必要的数据。例如:
Column_A Column_B Column_C
Jan 1 2018
Jan 4 2019
Feb 5 2018
Mar 3 2018
假设我只对 Column_A =='Jan'和C olumn_C ==“ 2018”感兴趣。
是否可以仅在Column_A ==“ Jan”和Column_C == 2018的情况下加载数据(因此在此示例中,仅应返回第1行)。
我找到了另一种解决方案,但不幸的是,这是“在内存中”(将数据加载到R后的数据处理):
impordata <- read.csv("big_file.csv")
impordata <- subset(impordata,Column_C ==2018 & Column_A =="Jan")