使用行过滤而不是读取+子集读取`data.table`

时间:2016-05-23 01:01:19

标签: r data.table

我需要将大量数据集读取到data.table。实际上,我不需要所有数据集,只需要在特定列中具有特定值的行。我可以使用read + subset进程执行它:

dt <- read.table(.......)
df_filtered <- subset(dt, Hash == '1AB3F' | Hash == 'DC167' | Hash == 'BCBC5')

有没有办法只读取满足Hash列限制的行?

1 个答案:

答案 0 :(得分:4)

您还可以使用管道通过grep读取文件。例如,要读入包含“e”的所有词典单词:

w <- read.table(pipe("grep e /usr/share/dict/words"))