R data.table中的性能下降,列数很多

时间:2014-04-25 11:41:35

标签: r performance data.table

我是data.table的新手,所以也许我错了。但是有可能的是,大量的列会导致大量的性能下降吗? E.g。

> dim(prob.2.gene)
[1] 482421     34

> key(prob.2.gene)
[1] "Symbol"


> dim(pat.met.normal.DT)
[1]     49 390953

> key(pat.met.normal.DT)
[1] "rn"


> system.time(prob.2.gene[J("ELMO2")])
       User      System verstrichen 
      0.016       0.000       0.015 

> system.time(pat.met.normal.DT[J("TCGA-CH-5763-01")])
       User      System verstrichen 
    148.230       0.298     149.424

也许你们其中一个人有提示。

最诚挚的问候,

马里奥

0 个答案:

没有答案