R中的掩蔽方法

时间:2015-06-04 10:31:45

标签: r dplyr r-package

This question,特别是this answer提出了以下问题:如何获得有关R中方法屏蔽的警告?

如果在干净的R会话中运行以下代码,您会注意到加载dplyr会更改lag的默认方法。

lag(1:3, 1)
## [1] 1 2 3
## attr(,"tsp")
## [1] 0 2 1
require(dplyr)
lag(1:3, 1)
## [1] NA  1  2

如果附加包dplyr,则会获得几个屏蔽对象的警告,但没有关于lag被屏蔽的默认方法的警告。原因是在调用lag时,会调用stats包中的泛型函数。

lag
## function (x, ...) 
## UseMethod("lag")
## <bytecode: 0x000000000c072188>
## <environment: namespace:stats>

methods(lag)只是告诉我有一个方法lag.default。我可以看到使用getAnywhere有两种方法:

getAnywhere(lag.default)
## 2 differing objects matching ‘lag.default’ were found
## in the following places
## registered S3 method for lag from namespace dplyr
## namespace:dplyr
## namespace:stats
## Use [] to view one of them

但这要求我知道检查lag是否更改了默认的dplyr方法。有没有办法检查方法是否被屏蔽?也许有这样的功能:

checkMethodMasking(dplyr)
## The following methods are masked from 'package:dplyr':
##    lag.default

注意:使用dplyr加载require(dplyr)时,发出警告是不够的。如果我只是在没有附加包的情况下加载命名空间(例如我调用dplyr::mutate),或者我使用另一个调用dplyr函数的包中的函数来导入importFrom,那么该方法也会被重载}})。

2 个答案:

答案 0 :(得分:8)

更新现在github上有一个试图解决这些问题的R包。它仍远不是一个理想的解决方案,但它在解决问题方面取得了很大进展。它目前有函数requirelibrarywarnS3Methods

devtools::install_github("blasern/warnS3")
require(warnS3)

# Examples
require2(dplyr)
## Loading required package: dplyr
##
## Attaching package: ‘dplyr’
##
## The following object is masked from ‘package:stats’:
##  
##  filter
##
## The following objects are masked from ‘package:base’:
##   
##  intersect, setdiff, setequal, union
## 
## The following methods are masked by 'package:dplyr':
##  
##  'lag.default' from 'package:stats'

require2(roxygen2)
## Loading required package: roxygen2
## The following methods are masked by 'package:roxygen2':
##  
##  'escape.character' from 'package:dplyr'

warnS3Methods()
## The following methods are available in multiple packages: 
##  
##  'escape.character' in packages: dplyr, roxygen2
##  'lag.default' in packages: dplyr, stats

这只是一个如何找到蒙面S3方法的想法。它绝不是一个完美的解决方案,但我想直到有人提出一个更好的想法,它至少会有助于debuging。

#' Get all S3 methods from a package
#' 
#' Find all S3 methods from a package
#' 
#' @param pkg can be either the name of an installed package
#' or the path of a package
getPkgS3Methods <- function(pkg){
  if (basename(pkg) == pkg) pkg <- path.package(pkg)
  ns <- parseNamespaceFile(basename(pkg), 
                           dirname(pkg), 
                           mustExist = FALSE)
  if (length(ns$S3methods) == 0) return(NULL)
  df <- cbind.data.frame(basename(pkg), ns$S3methods)
  colnames(df) <- c("package", "method", "class", "other")
  df
}

#' Get masked S3 methods
#' 
#' Finds all S3 methods that are currently available that are
#' duplicated
getMaskedS3Methods <- function(){
  paths <- as.character(gtools::loadedPackages(silent = TRUE)[, "Path"])
  lst <- lapply(paths, getPkgS3Methods)
  all_methods <- do.call(rbind, lst)
  duplicates <- 
  duplicated(all_methods[, c("method", "class")]) |
    duplicated(all_methods[, c("method", "class")], fromLast = TRUE)
  res <- all_methods[duplicates, ]
  res[order(res$method, res$class, res$package), ]
}

从干净的工作区调用(使用上述功能,但没有加载包),您可以观察以下内容:

getMaskedS3Methods()
## [1] package method  class   other  
## <0 rows> (or 0-length row.names)

require(dplyr)
getMaskedS3Methods()
## package method   class other
## 143   dplyr    lag default  <NA>
## 438   stats    lag default  <NA>

这只是告诉你这里有两个lag.default方法。它实际上并没有告诉你,哪一个掩盖了另一个。它只是指出潜在的问题。

答案 1 :(得分:1)

int[] result = new int[end-start+1]; for(int i = start; i <= end; i++){ result[j] = s[i]; } 程序包(请参阅here)现在为该问题提供了一种可能的解决方案。加载conflicted后,您将获得有关冲突的函数名称的更明确的错误消息。您还可以使用conflicted(详细信息here)指定默认情况下要使用的包功能,以及应屏蔽的包功能。

例如,这是我尝试使用conflict_prefer包中的函数parallel时遇到的最近错误:

nFactors

然后我添加了

# Error: [conflicted] `parallel` found in 2 packages.
# Either pick the one you want with `::` 
# * nFactors::parallel
# * lattice::parallel
# Or declare a preference with `conflict_prefer()`
# * conflict_prefer("parallel", "nFactors")
# * conflict_prefer("parallel", "lattice")

代码在脚本开头加载我的库之后,以确保conflict_prefer("parallel", "nFactors") 将在我的代码中调用parallel