如何将fitdistrplus :: fitdist摘要转换为整洁的格式?

时间:2018-07-20 02:57:15

标签: r tidyverse broom

我有以下代码:

x <- c(
  0.367141764080875, 0.250037975705769, 0.167204185003365, 0.299794433447383,
  0.366885973041269, 0.300453205296379, 0.333686861081341, 0.33301168850398,
  0.400142004893329, 0.399433677388411, 0.366077304765104, 0.166402979455671,
  0.466624230750293, 0.433499934139897, 0.300017278751768, 0.333673696762895,
  0.29973685692478
)

fn <- fitdistrplus::fitdist(x,"norm")
summary(fn)
#> Fitting of the distribution ' norm ' by maximum likelihood 
#> Parameters : 
#>        estimate Std. Error
#> mean 0.32846024 0.01918923
#> sd   0.07911922 0.01355908
#> Loglikelihood:  19.00364   AIC:  -34.00727   BIC:  -32.34084 
#> Correlation matrix:
#>      mean sd
#> mean    1  0
#> sd      0  1

基本上,它需要一个向量并试图拟合分布 使用fitdistrplus package

我尝试查看broom package,但没有 涵盖该功能的功能。

2 个答案:

答案 0 :(得分:4)

致电broom::tidy(fn)时会收到错误消息:

  

错误:fitdist类的对象没有整洁的方法

这是因为broom中的此函数仅包含有限数量的“好用”对象,有关完整列表,请参见methods(tidy)。 (Read more关于R中的S3方法。更多here)。

因此,该功能不适用于对象fitdist,但适用于fitdistr中的MASS对象(更“著名”)。

然后我们可以将fn分配给class,然后使用broom

class(fn) <- ("fitdist", "fitdistr") 
# notice that I've kept the original class and added the other
# you shouldn't overwrite classes. ie: don't to this: class(fn) <- "fitdistr"

broom::tidy(fn)
# # A tibble: 2 x 3
# term  estimate std.error
# <chr>    <dbl>     <dbl>
# 1 mean    0.328     0.0192
# 2 sd      0.0791    0.0136

请注意,您只能看到parameters。如果您希望看到更多内容并将所有内容整理为“整洁”,则应向我们详细说明您的预期输出。

broom::tidy()可以帮助您进一步发展,如果需要更多信息,我先定义自己的方法函数,该函数对class fitdist对象有效,并使用reference tidy.fitdistr方法并对其进行调整。


使用针对类broom::tidy()的S3方法如何适应原始fitdist代码的示例。

定义自己的方法(类似于定义自己的函数的方式):

# necessary libraries
library(dplyr)
library(broom)

# method definition:
tidy.fitdist <- function(x, ...) { # notice the use of .fitdist

  # you decide what you want to keep from summary(fn)
  # use fn$ecc... to see what you can harvest

  e1 <- tibble(
    term = names(x$estimate),
    estimate = unname(x$estimate),
    std.error = unname(x$sd)
  )

  e2 <- tibble(
    term = c("loglik", "aic", "bic"),
    value = c(unname(x$loglik), unname(x$aic), unname(x$bic))
  )

  e3 <- x$cor # I prefer this to: as_tibble(x$cor)

  list(e1, e2, e3) # you can name each element for a nicer result
  # example: list(params = e1, scores = e2, corrMatr = e3)
}

这是您现在可以如何调用此新method的方法:

tidy(fn) # to be more clear this is calling your tidy.fitdist(fn) under the hood.
# [[1]]
# # A tibble: 2 x 3
# term  estimate std.error
# <chr>    <dbl>     <dbl>
# 1 mean    0.328     0.0192
# 2 sd      0.0791    0.0136
# 
# [[2]]
# # A tibble: 3 x 2
# term   value
# <chr>  <dbl>
# 1 loglik  19.0
# 2 aic    -34.0
# 3 bic    -32.3
# 
# [[3]]
#      mean sd
# mean    1  0
# sd      0  1

请注意,class是:

class(fn)
[1] "fitdist"

所以现在您实际上不需要像以前一样分配fitdistr(来自MASS)类。

答案 1 :(得分:0)

不确定确切需要什么,但是可以尝试:

tidy_fn <- rbind(fn$estimate,fn$sd)

https://stats.stackexchange.com/questions/23539/use-fitdist-parameters-in-variables