根据这些问题here和here(以及我自己的痛苦经历),read.table
和read.csv
似乎无法提取引用文本中的转义引号。
理想情况下,我想使用相同的功能来摄取两者:
"column value 1","column \" value 2", NA, "column value 4"
并且
column value 1, column \" value 2, NA, column value 4
这些函数是否有其他替代方法可以读入R中引用文本中的转义引号?
提供给前面问题的解决方案似乎需要对文本中 else 的内容进行危险的假设(即,它总是被引用,或者它从来没有单引号),并且具有可以执行的功能处理带或不带引号列的CSV将非常有用。
答案 0 :(得分:-2)
除了半个世纪以来错误定义的CSV格式之外,您能否使用更现代,类型安全,高效的数据交换格式?协议缓冲区,JSON甚至XML都将为CSV提供显着的优势。 CSV根本不是一个定义明确的格式,而是一个特殊的非正式规范,因此如果没有关于生成输入CSV文件的更多信息,就不可能描述可以可靠地解析它的R函数。