我需要将大量数据集读取到data.table
。实际上,我不需要所有数据集,只需要在特定列中具有特定值的行。我可以使用read + subset进程执行它:
dt <- read.table(.......)
df_filtered <- subset(dt, Hash == '1AB3F' | Hash == 'DC167' | Hash == 'BCBC5')
有没有办法只读取满足Hash
列限制的行?
答案 0 :(得分:4)
您还可以使用管道通过grep
读取文件。例如,要读入包含“e”的所有词典单词:
w <- read.table(pipe("grep e /usr/share/dict/words"))