使用with()与调用向量有什么好处?

时间:2015-04-13 15:58:16

标签: r

我很好奇使用with()而不是调用矢量名称有什么好处(除了使用更少的击键)?

例如,with(d,x1)是否始终等同于d$x1

d

structure(list(x1 = c(-1.96300839219158, -1.7799470435444, -0.247433477421076, 
-0.333402872895705, -1.37145403620246, -0.23484024054114, -0.808080155419075, 
-0.359895157796401, 0.54316873679816, -0.687429214935226), x2 = c(-0.619089899920824, 
-0.0716448494478719, -0.136643798928645, 2.58777656543295, 0.758900617148999, 
0.687980864291582, 0.442931351818574, -0.734342463692198, 2.55862689249189, 
1.30677108261702)), .Names = c("x1", "x2"), row.names = c(NA, 
-10L), class = "data.frame")

1 个答案:

答案 0 :(得分:5)

如果您只是引用列表中的项目,例如数据框中的列,然后d$x1with(d, x1)都会从x1返回d。然而,就其自身而言,后者是相当不寻常的,并不是with()的真正目的;从列表中提取值是$的用途。

使用with()的优点是在单个环境的上下文中评估表达式,而不必担心全局变量或附加数据框使变量的引用模糊不清。

$语法不支持表达式,因此要在数据框中执行涉及多个变量的计算,您需要使用d$x1d$x2等不方便。但是,如果只是从列表中提取项目,则首选$


两种方法不相同的值得注意的情况如下。假设d被定义为

d <- data.frame(x1=c(1, 2, 3))

现在定义y <- "x1"。当我们尝试使用x1引用y时会发生什么?

> d$y
NULL

> with(d, y)
[1] "x1"

> d[, y]
[1] 1 2 3

d$y会返回NULL,因为y中没有列d,因此无法提取。

由于y中没有列dwith(d, y)y的父框架中查找d,其中包含y案例是全球环境。因此,这将评估全局环境中的"x1",从而返回y。即使无法提取, 也需要评估,因为d 确实存在,而不是d[, y]

现在y让我们得到了我们想要的东西。这首先评估d[, "x1"],将其转换为x1,这是使用其他变量从d中提取with()的正确语法。


David Arenburg提供的一些细节:

请注意,$实际上是执行方法分派的通用函数,而base:::with.default是原语。对function(data, expr, ...) eval(substitute(expr), data, enclos = parent.frame()) 的检查很有启发性:

with()

这用于确认$用于评估

由于.Primitive("$")是基元,因此它调用$,这意味着它在编译的内部代码中调用入口点。进行一些搜索显示do_subset3转到subset.c中名为/* The $ subset operator. We need to be sure to only evaluate the first argument. The second will be a symbol that needs to be matched, not evaluated. */ 的入口点。紧接在那段C代码之前的评论同样具有启发性:

$

这用于确认with()用于提取,而非评估。

简而言之,正如大卫在评论中所说的那样,$和{{1}}有不同的目的,在某些情况下可能会重叠。