Question

我有一个.csv文件，其中包含这样的情况（为了便于阅读而添加了额外的空格）：

1, 3 , "string" ,  "string4"     , NA
2, 5 , "string" , "s\"tring\"4"  , 3
1, 3 , "string" , "stri,ng4"     , 5
8, 7 , "string" , "st\"ri,n\"g4" , 5

我正在使用以下语句在Windows 10计算机上将其读入RStudio：

read.table("file_name.csv",fill=TRUE, header=FALSE, quote="\"", sep=",", encoding="UTF-8")

通过以下回复：

   V1 V2     V3           V4     V5 V6
 1  1  3 string      string4   <NA> NA
 2  2  5 string  s\\tring\\4      3 NA
 3  1  3 string     stri,ng4      5 NA
 4  8  7 string       st\\ri  n\\g4  5

问题似乎是第5行中转义引号内的逗号，它被解释为分隔符。

我期待/正在寻找像下面这样的东西，但我不确定如何得到它。

   V1 V2     V3            V4    V5 
 1  1  3 string       string4  <NA>
 2  2  5 string   s\"tring\"4     3
 3  1  3 string      stri,ng4     5
 4  8  7 string  st\"ri,n\"g4     5

我考虑使用grep重新处理文件来改变\“to'，但我很好奇是否有更直接的方法。这似乎是一个潜在的常见问题，但我找不到一个很好的例子解决方案。

想法，有人吗？

Answer 1

尝试使用read.table（＆＃34; file_name.csv＆＃34;）。它给了我想要的输出。

R read.table逗号在字符串

1 个答案: