我正在使用read.csv
阅读大型csv文件。一些网站建议使用colClasses定义每列的类,以使导入过程更快。
t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got 'NULL'
classes = c("numeric","integer")
我的一些数据显然有空值。有没有办法使用colClasses,其中“numeric”或“integer”包含空值?此外,有关将大型数据集更快地导入R的任何其他提示将非常有用。我拥有SQL数据库中的所有数据,并且我尝试使用RODBC,这比read.csv()慢得多。
答案 0 :(得分:11)
在致电na.strings='NULL'
时使用read.csv
。