下载数据集R时进行过滤

时间:2017-03-07 17:55:43

标签: r download dataset subset

我需要使用R在网上下载大型数据集,但我想学习如何在下载到我需要的日期时同时过滤它。现在,我已经设置下载和.unzip,然后我用过滤器创建另一个数据集。该文件是文本“;”分隔文件

有一个日期列,格式为1/1/2009,我只需要选择两个日期,3/1/2009和3/2/2009,如何在R中执行此操作?

当我导入它时,R将其设置为一个因子,因为我只需要这两个日期而且不需要做一个Between,我只选择这两个因素并称之为一天。

谢谢!

1 个答案:

答案 0 :(得分:0)

我不认为您可以在下载时进行过滤。要仅选择这些日期,您可以使用subset功能:

# do not convert string to factors
d.all = read.csv(file, ..., stringsAsFactors = FALSE, sep = ';')
# Date column is called DATE:
d.filter = subset(d.all, DATE %in% c("1/1/2009", "3/1/2009"))