fread不喜欢字段少于其他行的行

时间:2014-01-14 21:27:01

标签: r csv data.table

我正在使用fread读取一个包含16列和637501行的179mb CSV文件。 fread没有读取CSV文件的前29行。它也错过了第一行中的标题。我用过

fread("filename.csv",sep= ",")
fread("filename.csv",sep= "," , skip>=0L)
fread("filename.csv",sep= "," , skip>=1L)
fread("filename.csv",sep= ",", autostart=1L)

当我设置header = TRUE时,第30行被设置为标题,但是fread无法识别前29行。我能够读取读取相同文件read.csv而没有任何问题(只需要更长的时间)。

这是一个错误还是我错过了什么?

链接到产生相同错误(20kb)https://dl.dropboxusercontent.com/u/17747104/example.csv

的示例CSV

这是179mb文件的链接。 https://dl.dropboxusercontent.com/u/17747104/read.csv

1 个答案:

答案 0 :(得分:3)

正如您现在通过查看第30行实现的那样,它有16列,而其他行有36列。它似乎被切断了,就像数据错误一样。

修改fread在CRAN 2016年11月的v1.9.8中获得fill=TRUErelease notes。那应该解决它。