如何在扫帚包的tidy()函数输出中添加星星?

时间:2018-02-20 03:36:03

标签: r dataframe lm tidyverse broom

我一直在使用R中的扫帚包的tidy()功能来打印我的模型摘要。

然而,tidy()函数返回没有星星的p值,这使得许多习惯于在模型摘要中看到星星的人有点奇怪。

有没有人知道在输出中添加星星的方法?

4 个答案:

答案 0 :(得分:5)

我们可以使用来自stars.pval的便捷功能gtools来执行此操作

library(gtools)
library(broom)
library(dplyr)
data(mtcars)
mtcars %>%
   lm(mpg ~ wt + qsec, .) %>%
   tidy %>%
   mutate(signif = stars.pval(p.value))
#        term  estimate std.error  statistic      p.value signif
#1 (Intercept) 19.746223 5.2520617   3.759709 7.650466e-04    ***
#2          wt -5.047982 0.4839974 -10.429771 2.518948e-11    ***
#3        qsec  0.929198 0.2650173   3.506179 1.499883e-03     **

答案 1 :(得分:4)

这不是tidy的真正目的。它用于从各种对象中生成整洁的数据帧,而不是提供有关这些对象的其他指标。

您总是可以编写一个函数来根据p值生成星星,并为使用tidy生成的数据框添加一列。例如:

make_stars <- function(pval) {
  stars = ""
  if(pval <= 0.001)
    stars = "***"
  if(pval > 0.001 & pval <= 0.01)
    stars = "**"
  if(pval > 0.01 & pval <= 0.05)
    stars = "*"
  if(pval > 0.05 & pval <= 0.1)
     stars = "."
  stars
}

然后像:

library(broom)
library(dplyr)

mtcars %>% 
  lm(mpg ~ wt + qsec, .) %>% 
  tidy() %>% 
  mutate(signif = sapply(p.value, function(x) make_stars(x)))

         term  estimate std.error  statistic      p.value signif
1 (Intercept) 19.746223 5.2520617   3.759709 7.650466e-04    ***
2          wt -5.047982 0.4839974 -10.429771 2.518948e-11    ***
3        qsec  0.929198 0.2650173   3.506179 1.499883e-03     **

答案 2 :(得分:0)

这个问题已经得到了解答,但只是想指出这个比上面提到的gtools::stars.pval更灵活的另一个选项,因为它根据你选择的任何内容返回一个数据帧或一个向量。输入

# loading the necessary library
library(broom)
library(datasets)
library(dplyr)
library(devtools)
devtools::install_github("IndrajeetPatil/ipmisc")

# using the function
mtcars %>%
  stats::lm(mpg ~ wt + qsec, .) %>%
  broom::tidy(.) %>%
  ipmisc::signif_column(data = ., p = p.value)
#> # A tibble: 3 x 6
#>   term        estimate std.error statistic  p.value significance
#>   <chr>          <dbl>     <dbl>     <dbl>    <dbl> <chr>       
#> 1 (Intercept)   19.7       5.25       3.76 7.65e- 4 ***         
#> 2 wt            -5.05      0.484    -10.4  2.52e-11 ***         
#> 3 qsec           0.929     0.265      3.51 1.50e- 3 **

reprex package(v0.2.0)创建于2018-02-27。

答案 3 :(得分:0)

正如R中的printCoefmat函数所使用的,您还可以使用symnum包中的stats函数(包含在基本r中):

pv <- c(0.00001, 0.002, 0.02, 0.06, 0.12, 0.99)

stars <- symnum(pv, corr = FALSE, na = FALSE, 
       cutpoints = c(0, 0.001, 0.01, 0.05, 0.1, 1), 
       symbols = c("***", "**", "*", ".", " "))

# fetch the stars only
as.character(stars)
#> [1] "***" "**"  "*"   "."   " "   " "

# fetch the legend description
attr(stars, "legend")
#> [1] "0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1"

reprex package(v0.2.0)于2018-09-10创建。

或者精确地回答您的问题,您可以像这样使用它

library(dplyr)

pv <- c(0.00001, 0.002, 0.02, 0.06, 0.12, 0.99)

star_function <- function(x) {
  symnum(x, corr = FALSE, na = FALSE, 
         cutpoints = c(0, 0.001, 0.01, 0.05, 0.1, 1), 
         symbols = c("***", "**", "*", ".", " "))
}
stars <- star_function(pv)

# fetch the stars only
as.character(stars)
#> [1] "***" "**"  "*"   "."   " "   " "

# fetch the legend description
attr(stars, "legend")
#> [1] "0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1"

mtcars %>%
  stats::lm(mpg ~ wt + qsec, .) %>%
  broom::tidy(.) %>% 
  mutate(sign = as.character(star_function(p.value)))
#> # A tibble: 3 x 6
#>   term        estimate std.error statistic  p.value sign 
#>   <chr>          <dbl>     <dbl>     <dbl>    <dbl> <chr>
#> 1 (Intercept)   19.7       5.25       3.76 7.65e- 4 ***  
#> 2 wt            -5.05      0.484    -10.4  2.52e-11 ***  
#> 3 qsec           0.929     0.265      3.51 1.50e- 3 **

reprex package(v0.2.0)于2018-09-10创建。