读取大数据的子集

时间:2017-03-29 21:43:19

标签: r subset

我有一个超过1亿行的LARGE数据集。我只想读取部分数据对应一个特定级别的因子,比如column1 == A.如何使用read.csv在R中完成此操作?

谢谢

1 个答案:

答案 0 :(得分:0)

您无法使用read.csv过滤行。您可以按照答案to this question中的说明尝试sqldf::read.csv.sql

但我认为大多数人会首先使用其他工具处理该文件。例如,csvkit允许按行过滤。