在R中导入csv文件

时间:2016-10-08 11:27:58

标签: r csv

我在阅读csv文件时遇到了麻烦。当我在记事本中打开csv文件时,它看起来像这样:

`USER` `USER_TYPE` `V1` `V2` `V3` `V4` `V5` `V6` `V7` `V8` `V9` `V10`
508 `Gemandateerde zonder werk` 8 4 1 2 `` `` `` `` 1 1
510 `Gemandateerde zonder werk` 8 4 2 `` `` `` `` `` 1 1
511 `Gemandateerde met werk` 8 3 1 2 `` `` `` `` 1 1
512 `Kind` 8 4 1 2 2 2 2 1 1 1
513 `Kind` 5 4 1 1 2 3 6 2 1 1
514 `Kind` 2 3 1 2 `` `` `` `` 1 2
515 `Gemandateerde zonder werk` 8 4 1 1 2 6 2 1 1 1
516 `Gemandateerde met werk` 8 2 1 1 2 4 1 2 1 2
517 `Kind` 8 2 1 2 `` `` `` `` 1 1
519 `Kind` 8 4 1 1 2 2 6 2 1 1
520 `Kind` 8 3 1 1 2 4 2 1 1 1

我使用了以下调用(尝试了不同的东西):

df <- read.csv("file.csv", header = TRUE, sep = "")

R返回:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
more columns than column names

我看不出我做错了什么,第一行中有多少变量名称作为第一行中第二行的数据点,有人可以帮助我吗?

1 个答案:

答案 0 :(得分:3)

您似乎有反引用引用您的数据。尝试:

> read.csv("~/Downloads/file.csv",sep="",head=TRUE,quote="`")
   USER                 USER_TYPE V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   508 Gemandateerde zonder werk  8  4  1  2 NA NA NA NA  1   1
2   510 Gemandateerde zonder werk  8  4  2 NA NA NA NA NA  1   1
3   511    Gemandateerde met werk  8  3  1  2 NA NA NA NA  1   1
4   512                      Kind  8  4  1  2  2  2  2  1  1   1
5   513                      Kind  5  4  1  1  2  3  6  2  1   1
6   514                      Kind  2  3  1  2 NA NA NA NA  1   2

CSV通常包含单引号或双引号字符。在没有告诉R'是你的引用字符的情况下,它将`Gemandateerde zonder werk`视为由空格分隔的三个字段,这解释了错误信息。