R read.table逗号在字符串

时间:2017-05-18 16:04:39

标签: r csv escaping read.table

我有一个.csv文件,其中包含这样的情况(为了便于阅读而添加了额外的空格):

1, 3 , "string" ,  "string4"     , NA
2, 5 , "string" , "s\"tring\"4"  , 3
1, 3 , "string" , "stri,ng4"     , 5
8, 7 , "string" , "st\"ri,n\"g4" , 5

我正在使用以下语句在Windows 10计算机上将其读入RStudio:

read.table("file_name.csv",fill=TRUE, header=FALSE, quote="\"", sep=",", encoding="UTF-8")  

通过以下回复:

   V1 V2     V3           V4     V5 V6
 1  1  3 string      string4   <NA> NA
 2  2  5 string  s\\tring\\4      3 NA
 3  1  3 string     stri,ng4      5 NA
 4  8  7 string       st\\ri  n\\g4  5

问题似乎是第5行中转义引号内的逗号,它被解释为分隔符。

我期待/正在寻找像下面这样的东西,但我不确定如何得到它。

   V1 V2     V3            V4    V5 
 1  1  3 string       string4  <NA>
 2  2  5 string   s\"tring\"4     3
 3  1  3 string      stri,ng4     5
 4  8  7 string  st\"ri,n\"g4     5

我考虑使用grep重新处理文件来改变\“to',但我很好奇是否有更直接的方法。这似乎是一个潜在的常见问题,但我找不到一个很好的例子解决方案。

想法,有人吗?

1 个答案:

答案 0 :(得分:-1)

尝试使用read.table(&#34; file_name.csv&#34;)。它给了我想要的输出。