我尝试使用默认设置导入由MySQL SELECT … INTO OUTFILE
生成的CSV文件。数据库生成一个很好的制表符分隔文件,它显然以我从未见过的方式转义制表符和换行符:文字换行符(ASCII代码10)或制表符(ASCII代码9)前面带有反斜杠。 / p>
包含三个字段的文件示例(我在此使用→
表示制表符):
没有任何逃脱的法线:
field1→field2→field3
第一个字段包含转义制表符:
long\→field1→field2→field3
第一个字段包含换行符:
long\
field1→field2→field3
我试图使用:
scan('file.csv', what=list('character', 'character', 'character'), sep='\t', quote='', na.strings='\\N', allowEscapes=TRUE)
...但是allowEscapes
参数并没有抓住这种情况。有没有办法导入这样的文件?