我已经导入了一个拥有180万行的DF(在终端和Rapidminer中确认读取了正确的数字)。当我通过read.csv在R中导入这些行时,行数仅为1.2(因此它没有看到30%的数据?!)。
这是我的代码:
rm(list=ls())
DF<-read.csv("/Users/marcoduz/Desktop/PhD/DataSet.csv")
attach(DF)
我已经能够在没有任何错误消息的情况下做我需要对数据集做的事情,然后注意到行数是错误的。
我也尝试了如下运气(在第一个命令中说
)"Error in read.table : more columns than column names"):
tab5rows <- read.table("/Users/marcoduz/Desktop/PhD/DataSet.csv", header=TRUE, nrows=5)
classes <- sapply(tab5rows, class)
DF<-read.csv("/Users/marcoduz/Desktop/PhD/DataSet.txt", sep=",", header=TRUE, colclasses=classes)
当我查看DF时,DF的结构似乎是正确的(但是我只能看到前1000行)。有人知道发生了什么吗?