data.table :: fread and Unbalanced“

时间:2013-04-18 22:18:16

标签: r data.table fread

当我尝试使用data.table:fread(fn, sep='\t', header=T)读取csv文件时,它会在此行上显示“不平衡”错误。数据有3个整数变量和1个字符串变量.csv文件中的字符串不是附带",是的,有些行在字符串变量中包含",而"字符不是成对的。

我想知道是否可以让fread忽略变量中未配对的"并继续读取数据?感谢。

以下是样本数据(只有一条记录)

N_ID    VISIT_DATE  REQ_URL REQType
175931  2013-3-8 23:40:30   http://aaa.com/rest/api2.do?api=getSetMobileSession&data={"imei":"60893ZTE-CN13cd","appkey":"android_client","content":"Z0JiRA0qPFtWM3BYVltmcx5MWF9ZS0YLdW1ydXoqPycuJS8idXdlY3R0TGBtU   1

1 个答案:

答案 0 :(得分:6)

更新:现已在v1.8.11中实施

来自新闻:

  

fread现在接受字段中间的引号('和'),   该字段是否以“是否”开头,而不是“不平衡”   引用'错误,#2694。感谢白道报道。它是众所周知的   记录在?fread(文本现已删除)的顶部。如果一个字段开始   用“它必须以...结尾”(如果字段分隔符本身在   现场内容)。嵌入式引号也可以是列名。换行符(\ n)   仍然不能在引用字段或引用的列名中。


是的,正如@agstudy所说,由于fread是新的,嵌入式引号是一个尚未实现的已知文档问题。严格地说,我认为这些不是嵌入的,因为你的例子中的字符串不是以引号开头的。

无论如何,我已将此作为错误报告提交,因此不会被遗忘。要在下一个版本中完成。感谢您的重点。

#2694 : Strings including quotes but not starting with quote in fread