我有一个带有额外空格的csv文件,我想将其作为数据帧读入R中,剥离空格。
这可以通过使用
来实现testdata<-read.csv("file.csv", strip.white=TRUE)
问题是数据集很大并且需要大约半小时。 fread函数至少快两倍,但没有strip.white函数。
library("data.table")
testdata<-data.frame(fread("file.csv"))
有没有一种快速方法可以在读入后从列中剥离空白区域,或者是否有某种方法可以使用fread去除空白区域?
如果它只是一次导入,我不会那么介意,但我需要多次这样做并定期。
答案 0 :(得分:4)
现在strip.white
中有一个参数TRUE
默认设置为fread
,您也可以将data.table = FALSE
传递给fread
以接收阅读数据集后data.frame
答案 1 :(得分:3)
您可以使用str_trim
包中的stringr
:
library(stringr)
testdata[,sapply(.SD,str_trim)]
默认情况下,它会修剪两侧的whitesapces,但您可以设置侧面:
testdata[,sapply(.SD,str_trim,side="left")]