我用:
read.csv('....csv', as.is=TRUE, header=TRUE)
第一行中有一个标题但没有该行仍有72139行,但我只能读取72138行。我无法弄清楚为什么R会自动省略一行。
我查了前几行,没有问题。
更新: 我尝试了另一个类似的csv,R错过了超过10000行......然后我在这里找到了答案...... read.csv in R doesn't import all rows from csv file
我使用quote =""在我的read.csv()中,但是你必须小心你的角色变量。
我仍然很好奇,因为其他一些csv文件也有双引号但行数较少(大约30000)但我之前从未犯过任何错误......有人可以帮我解决这个问题吗?
感谢
答案 0 :(得分:0)
如何计算文件中的行数? wc -l
?如果有一个空行(最可能在文件的最后一行),wc
也会包含它。
如果没有,您可以使用write.csv
编写数据帧,并使用diff
之类的内容将结果与原始数据文件进行比较,以查看哪一行缺失。
答案 1 :(得分:0)
我对于50,000行的数据集也遇到了同样的问题,只有大约一半的内容是使用read.csv导入的。这里和其他论坛中的建议都没有为我工作。立即解决问题的是我的顾问的建议,改为使用“ readr”包中的read_csv。以下是说明:https://readr.tidyverse.org/