应用错误收集

读取大数据的子集

时间：2017-03-29 21:43:19

标签： r subset

我有一个超过1亿行的LARGE数据集。我只想读取部分数据对应一个特定级别的因子，比如column1 == A.如何使用read.csv在R中完成此操作？

谢谢

1 个答案:

答案 0 :(得分：0)

您无法使用read.csv过滤行。您可以按照答案to this question中的说明尝试sqldf::read.csv.sql。

但我认为大多数人会首先使用其他工具处理该文件。例如，csvkit允许按行过滤。