我很好奇使用with()
而不是调用矢量名称有什么好处(除了使用更少的击键)?
例如,with(d,x1)
是否始终等同于d$x1
?
d
structure(list(x1 = c(-1.96300839219158, -1.7799470435444, -0.247433477421076,
-0.333402872895705, -1.37145403620246, -0.23484024054114, -0.808080155419075,
-0.359895157796401, 0.54316873679816, -0.687429214935226), x2 = c(-0.619089899920824,
-0.0716448494478719, -0.136643798928645, 2.58777656543295, 0.758900617148999,
0.687980864291582, 0.442931351818574, -0.734342463692198, 2.55862689249189,
1.30677108261702)), .Names = c("x1", "x2"), row.names = c(NA,
-10L), class = "data.frame")
答案 0 :(得分:5)
如果您只是引用列表中的项目,例如数据框中的列,然后d$x1
和with(d, x1)
都会从x1
返回d
。然而,就其自身而言,后者是相当不寻常的,并不是with()
的真正目的;从列表中提取值是$
的用途。
使用with()
的优点是在单个环境的上下文中评估表达式,而不必担心全局变量或附加数据框使变量的引用模糊不清。
$
语法不支持表达式,因此要在数据框中执行涉及多个变量的计算,您需要使用d$x1
,d$x2
等不方便。但是,如果只是从列表中提取项目,则首选$
。
两种方法不相同的值得注意的情况如下。假设d
被定义为
d <- data.frame(x1=c(1, 2, 3))
现在定义y <- "x1"
。当我们尝试使用x1
引用y
时会发生什么?
> d$y
NULL
> with(d, y)
[1] "x1"
> d[, y]
[1] 1 2 3
d$y
会返回NULL
,因为y
中没有列d
,因此无法提取。
由于y
中没有列d
,with(d, y)
在y
的父框架中查找d
,其中包含y
案例是全球环境。因此,这将评估全局环境中的"x1"
,从而返回y
。即使无法提取, 也需要评估,因为d
确实存在,而不是d[, y]
。
现在y
让我们得到了我们想要的东西。这首先评估d[, "x1"]
,将其转换为x1
,这是使用其他变量从d
中提取with()
的正确语法。
David Arenburg提供的一些细节:
请注意,$
实际上是执行方法分派的通用函数,而base:::with.default
是原语。对function(data, expr, ...)
eval(substitute(expr), data, enclos = parent.frame())
的检查很有启发性:
with()
这用于确认$
用于评估。
由于.Primitive("$")
是基元,因此它调用$
,这意味着它在编译的内部代码中调用入口点。进行一些搜索显示do_subset3
转到subset.c中名为/* The $ subset operator.
We need to be sure to only evaluate the first argument.
The second will be a symbol that needs to be matched, not evaluated.
*/
的入口点。紧接在那段C代码之前的评论同样具有启发性:
$
这用于确认with()
用于提取,而非评估。
简而言之,正如大卫在评论中所说的那样,$
和{{1}}有不同的目的,在某些情况下可能会重叠。