在Hmisc之后加载tidyverse时的评估错误

时间:2018-03-20 19:36:59

标签: r dplyr tidyverse hmisc

我使用的是r 3.3.3,dplyr 0.7.4和Hmisc 4.1-1。我注意到我加载包的顺序会影响dplyr :: summaries函数是否有效。我知道以不同的顺序加载包会掩盖某些函数,但我使用package :: function()语法来避免这个问题。确切的问题围绕标记变量。我知道过去有过tidyverse和变量标签的问题,但似乎都没有解决为什么会出现这种特殊情况。

第一个有效的例子 - 我只加载Hmisc然后加载dplyr并且我能够汇总数据 -

#this works fine
library(Hmisc)
library(dplyr)

Hmisc::label(iris$Petal.Width) <- "Petal Width"

sumpct <- iris %>% 
  dplyr::group_by(Species) %>% 
  dplyr::summarise(med =median(Petal.Width),A40 = round(100*ecdf(Petal.Width)(.40),1),
            A50 =round(100*ecdf(Petal.Width)(.50),1),
            mns = mean(Petal.Width),
            lowermean = mean(Petal.Width)-sd(Petal.Width),
            lowermedian = median(Petal.Width) - sd(Petal.Width))

下面的第二个例子打破了。我启动一个新的会话并在Hmisc之后加载tidyverse并仍然使用package :: function()语法,但这会引发错误:

  

summarise_impl(.data,dots)出错:评估错误:x和   labels必须是同一类型。

第二个例子:

###restart session 
#this example does not work

library(Hmisc)
library(tidyverse)


Hmisc::label(iris$Petal.Width) <- "Petal Width"

sumpct <- iris %>% 
  dplyr::group_by(Species) %>% 
  dplyr::summarise(med =median(Petal.Width),A40 = round(100*ecdf(Petal.Width)(.40),1),
                   A50 =round(100*ecdf(Petal.Width)(.50),1),
                   mns = mean(Petal.Width),
                   lowermean = mean(Petal.Width)-sd(Petal.Width),
                   lowermedian = median(Petal.Width) - sd(Petal.Width))

然而,第三个例子确实有用,我只是重启会话并在Hmisc之前加载tidyverse

第三个例子:

###switch order of loading packages and this works

library(tidyverse)
library(Hmisc)


Hmisc::label(iris$Petal.Width) <- "Petal Width"

sumpct <- iris %>% 
  dplyr::group_by(Species) %>% 
  dplyr::summarise(med =median(Petal.Width),A40 = round(100*ecdf(Petal.Width)(.40),1),
                   A50 =round(100*ecdf(Petal.Width)(.50),1),
                   mns = mean(Petal.Width),
                   lowermean = mean(Petal.Width)-sd(Petal.Width),
                   lowermedian = median(Petal.Width) - sd(Petal.Width)) 

所以我的问题是为什么我在使用package :: function()语法专门针对标记变量和tidyverse时加载包的顺序很重要?

更新:以下会话信息中的错误:

sessionInfo()
  
    

R版本3.3.3(2017-03-06)     运行于:Windows 7 x64       附加基础包:[1] stats graphics grDevices utils数据集方法库

  
     

其他附件包:[1] bindrcpp_0.2 forcats_0.3.0
  stringr_1.3.0 dplyr_0.7.4 [5] purrr_0.2.4 readr_1.1.1
  tidyr_0.8.0 tibble_1.4.2 [9] tidyverse_1.2.1 Hmisc_4.1-1
  ggplot2_2.2.1 Formula_1.2-2 [13] survival_2.41-3 lattice_0.20-35

     

通过命名空间加载(而不是附加):[1] reshape2_1.4.3
  splines_3.3.3 haven_1.1.1 [4] colorspace_1.3-2
  htmltools_0.3.6 base64enc_0.1-3 [7] rlang_0.2.0
  pillar_1.2.1 foreign_0.8-69 [10] glue_1.2.0
  RColorBrewer_1.1-2 readxl_1.0.0 [13] modelr_0.1.1
  plyr_1.8.4 bindr_0.1.1 [16] cellranger_1.1.0
  munsell_0.4.3 gtable_0.2.0 [19] rvest_0.3.2
  htmlwidgets_1.0 psych_1.7.8 [22] latticeExtra_0.6-28   knitr_1.20 parallel_3.3.3 [25] htmlTable_1.11.2
  broom_0.4.3 Rcpp_0.12.16 [28] acepack_1.4.1
  scales_0.5.0 backports_1.1.2 [31] checkmate_1.8.5
  jsonlite_1.5 gridExtra_2.3 [34] mnormt_1.5-5
  hms_0.4.2 digest_0.6.15 [37] stringi_1.1.7
  grid_3.3.3 cli_1.0.0 [40] tools_3.3.3
  magrittr_1.5 lazyeval_0.2.1 [43] cluster_2.0.6
  crayon_1.3.4 pkgconfig_2.0.1 [46] Matrix_1.2-12
  xml2_1.2.0 data.table_1.10.4-3 [49] lubridate_1.7.3
  assertthat_0.2.0 httr_1.3.1 [52] rstudioapi_0.7
  R6_2.2.2 rpart_4.1-13 [55] nnet_7.3-12
  nlme_3.1-131.1

1 个答案:

答案 0 :(得分:14)

更新:自haven version 2.0.0起,此问题已得到解决,因为避风港已标记为&#34; class已重命名为"haven_labelled",以避免与 Hmisc 发生冲突。

tl; dr:订单很重要。

要获得更详细的答案,请先重现错误:

library(Hmisc)
#> Loading required package: lattice
#> Loading required package: survival
#> Loading required package: Formula
#> Loading required package: ggplot2
#> 
#> Attaching package: 'Hmisc'
#> The following objects are masked from 'package:base':
#> 
#>     format.pval, units
library(tidyverse)
#> Warning: package 'forcats' was built under R version 3.4.4

从原始summarise示例中逐个删除元素后, 我设法减少了将错误重现到这些代码行:

Hmisc::label(iris$Petal.Width) <- "Petal Width"
head(iris)
#> Error: `x` and `labels` must be same type

我们可以查看回溯,看看我们是否可以找到可能导致错误的函数:

traceback()
#> 8: stop("`x` and `labels` must be same type", call. = FALSE)
#> 7: labelled(NextMethod(), attr(x, "labels"))
#> 6: `[.labelled`(xj, i)
#> 5: xj[i]
#> 4: `[.data.frame`(x, seq_len(n), , drop = FALSE)
#> 3: x[seq_len(n), , drop = FALSE]
#> 2: head.data.frame(iris)
#> 1: head(iris)

[.labelled电话看起来很可疑。为什么甚至被称为?

lapply(iris, class)
#> $Sepal.Length
#> [1] "numeric"
#> 
#> $Sepal.Width
#> [1] "numeric"
#> 
#> $Petal.Length
#> [1] "numeric"
#> 
#> $Petal.Width
#> [1] "labelled" "numeric" 
#> 
#> $Species
#> [1] "factor"

啊,为Petal.Width Hmisc::label设置标签也添加了S3类。 我们可以使用getAnywhere检查方法的定位:

getAnywhere("[.labelled")
#> 2 differing objects matching '[.labelled' were found
#> in the following places
#>   registered S3 method for [ from namespace haven
#>   namespace:Hmisc
#>   namespace:haven
#> Use [] to view one of them

确实,havenHmisc都定义了该方法。因为haven是 在Hmisc之后加载,首先找到它的定义,然后使用它:

getAnywhere("[.labelled")[1]
#> function (x, ...) 
#> {
#>     labelled(NextMethod(), attr(x, "labels"))
#> }
#> <environment: namespace:haven>

haven期望labelled个对象具有labels属性 Hmisc::label无法创建:

attr(iris$Petal.Width, "labels")
#> NULL

那就是错误的来源。

<小时/> 但等等:为什么haven甚至已加载?它没有附加library(tidyverse)。 事实证明,haven中的tidyverselisted as an imported package, 这会导致在连接包装时加载它(参见例如 here)。并加载包裹, 除其他外,注册其S3方法:这是冲突的地方 来自。

实际上,如果您想同时使用Hmisctidyverse,则订单很重要。 要解决这个问题,可能还需要更改源代码级别 包裹&#39;使用labelled S3类。

reprex package(v0.2.0)创建于2018-03-21。