加快数据清理过程

时间:2016-06-09 13:48:13

标签: r

我有一个1.2M行的csv文件,需要清理文件中的多个列。基本上删除需要清理的7列中的下划线之后的项目。以下代码工作需要3天才能完成。我有一个Perl脚本,在30秒内完成同样的操作,但如果可能的话,尽量保留R中的所有内容。有什么建议吗?

v<-c(11:14,16:18)

systime<-Sys.time()
for(m in 1:length(v)){
  for(i in 1:nrow(shots[,v[m]])){
    shots[i,v[m]]<-unlist(strsplit(shots[i,v[m]]    [[1]],split='_',fixed=TRUE))[1]
   }
}

需要删除下划线后的数据。

以下是列名称,显示了所需的一些数据以及需要在特定列中保留和删除的内容 1 42.30000 586.39276地名Name1 KEEP_remove KEEP_remove_remove No Mount KEEP_remove_remove 1 1

0 个答案:

没有答案