我正在尝试拆分最终将使用readLine()取出CSV文件的字符串。 (我知道read.csv()
效果更好,但CSV文件每行可以有不同的列数。例如,第1行有2列,第2行4行,第3行2行。)
说,我要解析的字符串如下所示:
2011-05-04,“weqr,wrqw”,“qweqrw”,12
最后,我希望它分为四个部分,这意味着我在逗号上分裂,但只有当逗号在引号之外时才会分开。
快速谷歌给了我一个JAVA解决方案,它利用了正则表达式",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)"
但是执行a<-strsplit(x,",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)")
之类的操作会产生错误:正则表达式无效。