R相关矩阵太慢 - 耗尽CPU

时间:2016-01-30 16:07:21

标签: r memory parallel-processing cpu cpu-usage

我的目标是生成5个样本的相关矩阵。我有> 100个基因和> 5000 lncs我想将每个基因与每个lncs相关联。

这些是我的2个输入文件的摘录: sigPCGDNp63KC.1.5f.p0.05.nofdr.v1.txt

GeneName    DNp63KC-1   DNp63KC-2   WTKC-1  WTKC-2  WTKC-3
Lphn2   15.5398625  14.6537125  24.7852 23.5052 31.387625
Ctbs    4.36166625  4.45151125  2.4854475   2.16731125  2.34724
Itgb4   0.262007875 0.203484625 114.0795    143.964875  128.9605
Tgs1    7.635635    7.68811875  4.86758 5.32287375  4.45235375
Sdr16c5 0   0   3.2194225   1.7414225   3.47433375
Cast    78.8140125  78.91005    150.98875   122.6945    136.10925
Rhobtb3 13.0326125  10.931615   5.2524  5.09462 5.72327625
Hyal1   2.70114125  3.75574625  23.3396625  16.00245    30.6743
Hpgds   0.030215425 0.03004895  6.80123625  5.15387875  5.54338

siglncDNp63KC.1.5f.p0.05.nofdr.vYan.txt:

GeneName    DNp63KC-1   DNp63KC-2   WTKC-1  WTKC-2  WTKC-3
Gm17597 0.166118375 0.225398    0.038626725 0.024296575 0.041762288
A930012L18Rik   0.328463    0.23827525  0.0811242   0.10030255  0.085353788
Gm3764  2.1724375   1.53431125  0   0   0
Mir143hg    1.5451225   1.67842125  0.02413365  0.119622663 0.069306413
1700028E10Rik   0   0   0.047058525 0.030703513 0.0229409
Gm26523 0.171209    0.16649225  0   0.013628296 0
Gm26527 14.1213375  14.28183125 0.744736875 6.869945    1.201424375
A530013C23Rik   0.292076125 0.361674375 0.1364565   0.092379575 0.0746007

为此,我编写了以下R脚本,它可以在小样本上正常运行:

payload.location.coordinates

然后我将每个矩阵输出到制表符分隔文件。

虽然上述组合了20个基因和20个lncs。任何大量的每个需要大约12个小时,但仍然没有完成。我在群集和本地计算机上运行它仍然没有完成。当我正在查看正在运行进程时使用的内存时,我看到不是我的内存被消耗了.R使用了不到400 MB,而我的CPU占用了100%的CPU。

如何划分CPU使用率以允许上述过程成功运行而无需等待这么长时间?任何建议,将不胜感激。请注意,我对内存和CPU使用情况有基本的了解。

0 个答案:

没有答案