我正在尝试从文件中提取数据,但仅根据列名提取某些列。
我有这段代码:
filepath <- ([my filepath])
files <- list.files(filepath, full.names=T)
newData <- fread(file,select=c(selectCols))
selectCols包含列名列表(作为字符串)。但是在我提取的数据中,对于相同的数据,每个文件中可能会有不同的下划线。
这是一个例子:
PERIOD_ID
PERIOD_ID_
_PERIOD_ID_
以此类推。我知道一旦数据被提取,我就可以使用gsub更改列名:
colnames(newData) <- gsub("_","",newData)
然后我可以按列名进行选择,但是鉴于有大量数据,我不确定这是最有效的主意。
在fread函数中是否可以忽略下划线或其他字符?