我想对76个观测值使用一个连续变量,并对29897个连续变量进行线性回归。一个的代码可能类似于:
lm(data=spread_gene_exp, spread_gene_exp[,i] ~ spread_gene_exp[,2])
其中i是29877 Y变量之一。
然后,我想从结果中提取系数估计值和P值,并将它们添加到某种数据框中,在这里我可以轻松地识别出哪些变量是最重要的。这可能需要某种循环,但是我不确定从哪里开始。
我很想在自己的台式机上运行此程序,但是它很可能会花费相当长的时间,因此可能必须在大学服务器上运行它,任何有关中端/半月-功能强大的桌面会有所帮助。