我有一个.csv文件,其中包含这样的情况(为了便于阅读而添加了额外的空格):
1, 3 , "string" , "string4" , NA
2, 5 , "string" , "s\"tring\"4" , 3
1, 3 , "string" , "stri,ng4" , 5
8, 7 , "string" , "st\"ri,n\"g4" , 5
我正在使用以下语句在Windows 10计算机上将其读入RStudio:
read.table("file_name.csv",fill=TRUE, header=FALSE, quote="\"", sep=",", encoding="UTF-8")
通过以下回复:
V1 V2 V3 V4 V5 V6
1 1 3 string string4 <NA> NA
2 2 5 string s\\tring\\4 3 NA
3 1 3 string stri,ng4 5 NA
4 8 7 string st\\ri n\\g4 5
问题似乎是第5行中转义引号内的逗号,它被解释为分隔符。
我期待/正在寻找像下面这样的东西,但我不确定如何得到它。
V1 V2 V3 V4 V5
1 1 3 string string4 <NA>
2 2 5 string s\"tring\"4 3
3 1 3 string stri,ng4 5
4 8 7 string st\"ri,n\"g4 5
我考虑使用grep重新处理文件来改变\“to',但我很好奇是否有更直接的方法。这似乎是一个潜在的常见问题,但我找不到一个很好的例子解决方案。
想法,有人吗?
答案 0 :(得分:-1)
尝试使用read.table(&#34; file_name.csv&#34;)。它给了我想要的输出。