我的目标是生成5个样本的相关矩阵。我有> 100个基因和> 5000 lncs我想将每个基因与每个lncs相关联。
这些是我的2个输入文件的摘录: sigPCGDNp63KC.1.5f.p0.05.nofdr.v1.txt
GeneName DNp63KC-1 DNp63KC-2 WTKC-1 WTKC-2 WTKC-3 Lphn2 15.5398625 14.6537125 24.7852 23.5052 31.387625 Ctbs 4.36166625 4.45151125 2.4854475 2.16731125 2.34724 Itgb4 0.262007875 0.203484625 114.0795 143.964875 128.9605 Tgs1 7.635635 7.68811875 4.86758 5.32287375 4.45235375 Sdr16c5 0 0 3.2194225 1.7414225 3.47433375 Cast 78.8140125 78.91005 150.98875 122.6945 136.10925 Rhobtb3 13.0326125 10.931615 5.2524 5.09462 5.72327625 Hyal1 2.70114125 3.75574625 23.3396625 16.00245 30.6743 Hpgds 0.030215425 0.03004895 6.80123625 5.15387875 5.54338
siglncDNp63KC.1.5f.p0.05.nofdr.vYan.txt:
GeneName DNp63KC-1 DNp63KC-2 WTKC-1 WTKC-2 WTKC-3 Gm17597 0.166118375 0.225398 0.038626725 0.024296575 0.041762288 A930012L18Rik 0.328463 0.23827525 0.0811242 0.10030255 0.085353788 Gm3764 2.1724375 1.53431125 0 0 0 Mir143hg 1.5451225 1.67842125 0.02413365 0.119622663 0.069306413 1700028E10Rik 0 0 0.047058525 0.030703513 0.0229409 Gm26523 0.171209 0.16649225 0 0.013628296 0 Gm26527 14.1213375 14.28183125 0.744736875 6.869945 1.201424375 A530013C23Rik 0.292076125 0.361674375 0.1364565 0.092379575 0.0746007
为此,我编写了以下R脚本,它可以在小样本上正常运行:
payload.location.coordinates
然后我将每个矩阵输出到制表符分隔文件。
虽然上述组合了20个基因和20个lncs。任何大量的每个需要大约12个小时,但仍然没有完成。我在群集和本地计算机上运行它仍然没有完成。当我正在查看正在运行进程时使用的内存时,我看到不是我的内存被消耗了.R使用了不到400 MB,而我的CPU占用了100%的CPU。
如何划分CPU使用率以允许上述过程成功运行而无需等待这么长时间?任何建议,将不胜感激。请注意,我对内存和CPU使用情况有基本的了解。