我正在尝试拆分数据框列,用独立逗号分隔,但忽略单引号中的逗号。我已经尝试了几件事但却无法工作。
以下是df
的简化版:
V1
'914061', 'Palo Alto'
'930061', 'Brooklyn, New York, USA'
期望的输出:
V1, V2
914061,Palo Alto
930061, Brooklyn, New York, USA (location in one cell)
我尝试了这个,但它分裂了布鲁克林,纽约和美国(并返回了关于矢量长度的警告)
df2 <- data.frame(do.call('rbind',strsplit(as.character(df$V1),',',fixed=TRUE)))
我也试过这个,但得到“文件中的错误(文件,”rt“):无效的”描述“参数”
df2 <- read.delim(df$V1, header=F, sep=',', dec = '.', stringsAsFactors=F , quote = "\"" , fill = TRUE)
答案 0 :(得分:2)
您使用了quote='"'
,您应该使用quote="'"
。并强制read.csv
将这两列作为变量读取,而不是将其转换为rownames。
read.csv(df$V1, quote="'", row.names=NULL)