在r中读取数据时跳过错误行

时间:2014-10-14 01:35:22

标签: r error-handling

我正在处理一个非常大的数据集,并且在读取数据时存在一些问题。 如果我使用fread,则错误消息为

Read 79.2% of 745115 rowsError in fread("~/final_top1MM.dat", na.strings = c("NA", "na", "null",  :
  Expected sep ('') but new line or EOF ends field 2614 on line 591349 when reading data: 103804269252304954413621513057004573381106206806030159757218413MAY2014-115.0425.000000126.000000000.00177358.1062711000APAC01011100001000Fusion000108581005721810380426925215130570045733811062068060301597572184-504158.125.244.229GBC21cc0010011010001002014-05-132014-05-13 03:29:25.013999769652014-05-132014-05-13 03:29:24.01399976964351843720893952419438873728257UIS00139997696101710858100572184031913999769611513057004573381106206806030159757218417815389507451886358.106266772133444.04.00.001765738606040597523.498526658374246E-7-2.0NO_DATAINVALID_TX-2ACCOUNT_INFANTNONONOMEDIP_BIN_MATCHNOCOUNTRY_MATCHNOSINGLE_IPNONONO_EVENTSONENO_NEWNO_EVENTSNO_PEEKINGOTHER0-19NO_LATNO_LATNO_LATMATCH_COUNTRYALL_FREENONONENAME_MATCHGOODCONTROLLED_HIGHUNKNOWNMEDFIXED_GEO_MATCH0.1963702538

如果我使用read.csv,它会报告无法分配内存。当我删除错误行时,read.csv工作正常。所以我认为这可能不是一个记忆问题。

那么有什么方法可以跳过报告错误的行,无论错误是什么?我怎么能用read.csv和fread来实现这一点? 提前谢谢。

0 个答案:

没有答案