我是data.table的新手,所以也许我错了。但是有可能的是,大量的列会导致大量的性能下降吗? E.g。
> dim(prob.2.gene)
[1] 482421 34
> key(prob.2.gene)
[1] "Symbol"
> dim(pat.met.normal.DT)
[1] 49 390953
> key(pat.met.normal.DT)
[1] "rn"
> system.time(prob.2.gene[J("ELMO2")])
User System verstrichen
0.016 0.000 0.015
> system.time(pat.met.normal.DT[J("TCGA-CH-5763-01")])
User System verstrichen
148.230 0.298 149.424
也许你们其中一个人有提示。
最诚挚的问候,
马里奥