读取.csv文件到R.错误扫描

时间:2013-11-26 19:41:20

标签: r csv

读取.csv文件,但收到以下错误:

Books <- read.table(file.choose(),header=TRUE,sep=";")
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
line 21688 did not have 3 elements

.csv文件名BX-Book-Ratings.csv

原始 - 1列和1048576行

显示 - 1列和10行

User-ID;"ISBN";"Book-Rating"        
276725;"034545104X";"0"     
276726;"0155061224";"5"     
276727;"0446520802";"0"     
276729;"052165615X";"3"     
276729;"0521795028";"6"     
276733;"2080674722";"0"     
276736;"3257224281";"8"     
276737;"0600570967";"6"     
276744;"038550120X";"7"

带错误的区域 - 行21687:21694

4376; “0345378490”; “0”
4376; “38208715X”; “5”
 4377; “\” 0210000010 “;” 8"
4385; “0061042331”; “0”
4385; “0061083402”; “10”
4385; “0061083577”; “0”
4385; “0061093343”; “9”
4385;“0061096156”;“10”

如果我能提供更多信息,请告诉我。谢谢。

1 个答案:

答案 0 :(得分:0)

我没有足够的声誉点将此添加为上述评论。你确定你在粘贴行21687:21694时是否正确计数?该错误应该在21688行,但下面的行有不匹配的引号......数据清理是此类分析中的一个重要步骤。

4377; “\” 0210000010 “;” 8"