我尝试从here
下载csv文件我使用以下代码阅读
storm_data = read.csv('./data/repdata/StormData.csv',sep=",", stringsAsFactors=F)
它返回692288次观察和错误消息
Warning message:In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
EOF within quoted string
结果是错误的,因为列值相互混合。
然后我尝试了read.table方法
storm_data = read.table('./data/repdata/StormData.csv',sep=",", head=T, stringsAsFactors=F)
并返回
的错误消息Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 547364 did not have 37 elements
我从547364中拾取相邻的行并读入单独的文本文件,然后显示OK。所以问题不是真的存在,而是在上面的某个地方。
最后,我尝试用excel读取它,它读得很好(所以我的coursera TA与read.csv)。它运行正常,得到了903871行。
我完全迷失了如何调试脚本。
这是我的环境信息。 我的R版本是3.1.1,Rstudio版本是0.98.1028。(32位),操作系统是赢8.1(64位)。
PS:我在堆栈溢出时尝试了所有相关的方法,但都没有。如果我设置quote =“”,则行是错误的。 fread不起作用,因为我在csv文件中得到了。