R fread and strip white

时间:2014-03-31 08:54:07

标签: r csv fread strip removing-whitespace

我有一个带有额外空格的csv文件,我想将其作为数据帧读入R中,剥离空格。

这可以通过使用

来实现
testdata<-read.csv("file.csv", strip.white=TRUE)

问题是数据集很大并且需要大约半小时。 fread函数至少快两倍,但没有strip.white函数。

library("data.table")
testdata<-data.frame(fread("file.csv"))

有没有一种快速方法可以在读入后从列中剥离空白区域,或者是否有某种方法可以使用fread去除空白区域?

如果它只是一次导入,我不会那么介意,但我需要多次这样做并定期。

2 个答案:

答案 0 :(得分:4)

现在strip.white中有一个参数TRUE默认设置为fread,您也可以将data.table = FALSE传递给fread以接收阅读数据集后data.frame

答案 1 :(得分:3)

您可以使用str_trim包中的stringr

library(stringr)
testdata[,sapply(.SD,str_trim)]

默认情况下,它会修剪两侧的whitesapces,但您可以设置侧面:

testdata[,sapply(.SD,str_trim,side="left")]