如何在忽略某些字符的同时按名称选择列?

时间:2018-10-02 17:22:20

标签: r regex data.table fread

我正在尝试从文件中提取数据,但仅根据列名提取某些列。

我有这段代码:

filepath <- ([my filepath])
files <- list.files(filepath, full.names=T)
newData <- fread(file,select=c(selectCols))

selectCols包含列名列表(作为字符串)。但是在我提取的数据中,对于相同的数据,每个文件中可能会有不同的下划线。

这是一个例子:

PERIOD_ID
PERIOD_ID_
_PERIOD_ID_

以此类推。我知道一旦数据被提取,我就可以使用gsub更改列名:

colnames(newData) <- gsub("_","",newData)

然后我可以按列名进行选择,但是鉴于有大量数据,我不确定这是最有效的主意。

在fread函数中是否可以忽略下划线或其他字符?

0 个答案:

没有答案