带有colClasses的read.csv出错:scan()期望'真实'得'NULL'

时间:2012-06-19 20:03:38

标签: r csv import

我正在使用read.csv阅读大型csv文件。一些网站建议使用colClasses定义每列的类,以使导入过程更快。

t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
scan() expected 'a real', got 'NULL'

classes = c("numeric","integer")

我的一些数据显然有空值。有没有办法使用colClasses,其中“numeric”或“integer”包含空值?此外,有关将大型数据集更快地导入R的任何其他提示将非常有用。我拥有SQL数据库中的所有数据,并且我尝试使用RODBC,这比read.csv()慢得多。

1 个答案:

答案 0 :(得分:11)

在致电na.strings='NULL'时使用read.csv