如何从apply函数中的lm函数提取p值?

时间:2019-06-13 20:52:09

标签: r apply lm p-value

我在大约700,000列上重复了lm函数。我正在使用apply函数在数据的列上重复lm。然后,我需要提取所有pvalue。当我打印lm函数的摘要时,pvalue列在Pr(> | t |)下。

我尝试使用pvals <- sapply(result,"[[", "p.value"),但结果为NULL。

这是现在打印3列lm摘要的代码(我正在使用一个较小的文件进行测试)。

result <- apply(dat4[,-c(1:27)], 2, function(x) {
  summary(lm(x ~ total + age + female + diagnosis_MDD + diagnosis_BP))
})
result

这只是一列的输出:

$cg05451842

Call:
lm(formula = x ~ total + age + female + diagnosis_MDD + diagnosis_BP)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.008621 -0.002647  0.001077  0.002979  0.006320 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)    2.658e-02  3.428e-03   7.753 1.72e-09 
total         -3.603e-04  1.007e-03  -0.358   0.7224    
age           -1.123e-04  6.765e-05  -1.659   0.1049    
female         7.997e-04  1.268e-03   0.631   0.5318    
diagnosis_MDD -3.487e-03  1.534e-03  -2.273   0.0285   
diagnosis_BP  -1.692e-03  1.586e-03  -1.067   0.2926


Signif. codes:  0      0.001      0.01     0.05     0.1     1

Residual standard error: 0.004242 on 40 degrees of freedom
Multiple R-squared:  0.1723,    Adjusted R-squared:  0.06879 
F-statistic: 1.665 on 5 and 40 DF,  p-value: 0.1654

2 个答案:

答案 0 :(得分:3)

tidy软件包中的broom函数通过为给定回归模型生成系数和p值的标准数据框,使此操作变得更加容易。您可以使用map_df遍历整个回归摘要列表,并对每个模型运行tidy函数,从而将所有模型的所有回归系数和相关的p值放入单个数据框中。列表元素:

library(broom)
library(tidyverse)

regression.results = map_df(result, tidy, .id="outcome.var")

如果只需要p值,则可以执行以下操作:

p.values = regression.results %>% select(outcome.var, term, p.value)

或者,一步一步完成:

p.values = map_df(result, ~tidy(.x) %>% select(term, p.value), 
                  .id="outcome.var")

答案 1 :(得分:0)

您正在创建一个不同对象的列表。您可以通过以下方式致电给他们:

result[[i]]

您要做的就是从中获取p值。由于您需要Pr(> | t |),因此可以通过以下方式获得它们:

result[[i]]$coefficients[c(7,8)]