我是R的新手,我正在处理多个行数高达100MM的GB文件。我不想读取整个数据文件,而是优先阅读一列,根据特定标准对其进行子集化,并使用结果索引从另一列读取数据进行分析。
即,我将我的数据列(我们称之为ID
)的子集与另一个数组中的值匹配,如下所示。
rowind = which(ID[,1] %in% Zid);
然后,当我在另一列中读取进行处理时,我只想读取那些与rowind
中的数字匹配的行。
我已经做了很多搜索 - 我知道如何跳过特定的列并在数据帧的开头跳过一定数量的行,但我不知道怎么读,比如说行[3 ,5,8,11,15]等。