当我尝试使用data.table:fread(fn, sep='\t', header=T)
读取csv文件时,它会在此行上显示“不平衡”错误。数据有3个整数变量和1个字符串变量.csv文件中的字符串不是附带"
,是的,有些行在字符串变量中包含"
,而"
字符不是成对的。
我想知道是否可以让fread
忽略变量中未配对的"
并继续读取数据?感谢。
以下是样本数据(只有一条记录)
N_ID VISIT_DATE REQ_URL REQType
175931 2013-3-8 23:40:30 http://aaa.com/rest/api2.do?api=getSetMobileSession&data={"imei":"60893ZTE-CN13cd","appkey":"android_client","content":"Z0JiRA0qPFtWM3BYVltmcx5MWF9ZS0YLdW1ydXoqPycuJS8idXdlY3R0TGBtU 1
答案 0 :(得分:6)
更新:现已在v1.8.11中实施
来自新闻:
fread现在接受字段中间的引号('和'), 该字段是否以“是否”开头,而不是“不平衡” 引用'错误,#2694。感谢白道报道。它是众所周知的 记录在?fread(文本现已删除)的顶部。如果一个字段开始 用“它必须以...结尾”(如果字段分隔符本身在 现场内容)。嵌入式引号也可以是列名。换行符(\ n) 仍然不能在引用字段或引用的列名中。
是的,正如@agstudy所说,由于fread
是新的,嵌入式引号是一个尚未实现的已知文档问题。严格地说,我认为这些不是嵌入的,因为你的例子中的字符串不是以引号开头的。
无论如何,我已将此作为错误报告提交,因此不会被遗忘。要在下一个版本中完成。感谢您的重点。
#2694 : Strings including quotes but not starting with quote in fread