我在阅读csv文件时遇到了麻烦。当我在记事本中打开csv文件时,它看起来像这样:
`USER` `USER_TYPE` `V1` `V2` `V3` `V4` `V5` `V6` `V7` `V8` `V9` `V10`
508 `Gemandateerde zonder werk` 8 4 1 2 `` `` `` `` 1 1
510 `Gemandateerde zonder werk` 8 4 2 `` `` `` `` `` 1 1
511 `Gemandateerde met werk` 8 3 1 2 `` `` `` `` 1 1
512 `Kind` 8 4 1 2 2 2 2 1 1 1
513 `Kind` 5 4 1 1 2 3 6 2 1 1
514 `Kind` 2 3 1 2 `` `` `` `` 1 2
515 `Gemandateerde zonder werk` 8 4 1 1 2 6 2 1 1 1
516 `Gemandateerde met werk` 8 2 1 1 2 4 1 2 1 2
517 `Kind` 8 2 1 2 `` `` `` `` 1 1
519 `Kind` 8 4 1 1 2 2 6 2 1 1
520 `Kind` 8 3 1 1 2 4 2 1 1 1
我使用了以下调用(尝试了不同的东西):
df <- read.csv("file.csv", header = TRUE, sep = "")
R返回:
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
more columns than column names
我看不出我做错了什么,第一行中有多少变量名称作为第一行中第二行的数据点,有人可以帮助我吗?
答案 0 :(得分:3)
您似乎有反引用引用您的数据。尝试:
> read.csv("~/Downloads/file.csv",sep="",head=TRUE,quote="`")
USER USER_TYPE V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1 508 Gemandateerde zonder werk 8 4 1 2 NA NA NA NA 1 1
2 510 Gemandateerde zonder werk 8 4 2 NA NA NA NA NA 1 1
3 511 Gemandateerde met werk 8 3 1 2 NA NA NA NA 1 1
4 512 Kind 8 4 1 2 2 2 2 1 1 1
5 513 Kind 5 4 1 1 2 3 6 2 1 1
6 514 Kind 2 3 1 2 NA NA NA NA 1 2
CSV通常包含单引号或双引号字符。在没有告诉R'是你的引用字符的情况下,它将`Gemandateerde zonder werk`视为由空格分隔的三个字段,这解释了错误信息。