如何在read.csv.ffdf中选择colClasses?

时间:2014-11-09 11:02:02

标签: r csv

如果整数列中有这样的值,我应该如何选择read.csv.ffdf的colClasses arg以输入NA值?

稍后我需要将该类转换为数字,以便我可以计算......

我用read.csv成功了,但它没有用,因为我有大量的数据,我需要更快的方法(read.csv.ffdf)。

我的问题示例如下:

b1 <- read.csv("file.csv", header=TRUE, colClasses="character")
g <- b1$numeric.column
g1 <- type.convert(g, na.strings = "NA", as.is = FALSE, dec = ".", numerals = "allow.loss")
g1 <- g1[!is.na(g1)]
mean(g1) #this one is ok


a1 <- read.csv.ffdf(file="file.csv", header=TRUE, VERBOSE=TRUE, first.rows=1000, next.rows=700000, colClasses="factor")
h <- a1$numeric.column
h1 <- as.numeric(h)
h1
numeric(0) #is not converted to numeric
h11 <- as.integer(h)
h11
integer(0)

有没有其他方法输入数字列(来自巨大的csv数据)尽管NA值很少?然后将该值用作数字...

谢谢!

0 个答案:

没有答案