有人可以向我解释这种行为吗?
a <- b <- c <- new.env()
a$this <- 1
b$this
# 1
c$this
# 1
我原本以为a / b / c会是不同的环境,就像以同样方式创建的变量一样?
但是,在全局环境中会显示三个环境,但是对一个环境的任何操作都会被推送到所有环境中。
答案 0 :(得分:13)
免责声明:这个答案可能不完全是SFW,因为S-Expressions是R中所有对象的常见类型,缩写为SEXP(是的,S-EXPression,连字符不在你想象的地方)。现在SALT 'N' PEPA曾唱歌:让我们谈谈SEXP!
TL; DR:环境作为指针存储在其父环境中,复制变量以访问它,只需复制指针并仍然以同一对象为目标。
我做了一些根本原因的挖掘,主要原因是什么是环境,或者实际上,它是如何存储在它的父环境中的。我们来看看new.env
:
> new.env
function (hash = TRUE, parent = parent.frame(), size = 29L)
.Internal(new.env(hash, parent, size))
<bytecode: 0x0000000005972428>
<environment: namespace:base>
好的,是时候转到源代码了,names.c
:
{"new.env", do_newenv, 0, 11, 3, {PP_FUNCALL, PREC_FN, 0}},
搜索do_newenv
会将我们带回builtin.c
返回(我在此处使用了快捷方式,但让我们保持这不会太久):
ans = NewEnvironment(R_NilValue, R_NilValue, enclos);
此NewEnvironment
定义为here in memory.c
,上面的评论为我们提供了有关正在发生的事情的线索:
通过扩展&#34; rho&#34;创建一个环境。用一个框架获得 将标签上给出的变量名称配对在&#34;名单和#34;随着 由&#34; valuelist&#34;。
的元素给出的值
代码本身并不容易理解:
SEXP NewEnvironment(SEXP namelist, SEXP valuelist, SEXP rho)
{
SEXP v, n, newrho;
if (FORCE_GC || NO_FREE_NODES()) {
PROTECT(namelist);
PROTECT(valuelist);
PROTECT(rho);
R_gc_internal(0);
UNPROTECT(3);
if (NO_FREE_NODES())
mem_err_cons();
}
GET_FREE_NODE(newrho);
newrho->sxpinfo = UnmarkedNodeTemplate.sxpinfo;
INIT_REFCNT(newrho);
TYPEOF(newrho) = ENVSXP;
FRAME(newrho) = valuelist;
ENCLOS(newrho) = CHK(rho);
HASHTAB(newrho) = R_NilValue;
ATTRIB(newrho) = R_NilValue;
v = CHK(valuelist);
n = CHK(namelist);
while (v != R_NilValue && n != R_NilValue) {
SET_TAG(v, TAG(n));
v = CDR(v);
n = CDR(n);
}
return (newrho);
}
与gsetVar
中的全球环境中的变量定义(例如,选择读者心灵的理智)相比:
void gsetVar(SEXP symbol, SEXP value, SEXP rho)
{
if (FRAME_IS_LOCKED(rho)) {
if(SYMVALUE(symbol) == R_UnboundValue)
error(_("cannot add binding of '%s' to the base environment"),
CHAR(PRINTNAME(symbol)));
}
#ifdef USE_GLOBAL_CACHE
R_FlushGlobalCache(symbol);
#endif
SET_SYMBOL_BINDING_VALUE(symbol, value);
}
我们可以看到&#34;价值&#34;从父环境可访问的是新的环境地址,由GET_FREE_NODE
在父环境中给出(我不确定我在这里清楚,但我没有找到正确的措辞)。< / p>
因此事实<-
定义为x <- value
我们正在复制指针,我们有多个自变量,都指向同一个对象。
使用任何引用更新对象会更新内存中唯一的对象。
SEXP
代表各种文学的S-Expression,主要是C中的指针。
来自评论,
答案 1 :(得分:7)
new.env()
只被调用一次,只创建一个新环境。它们都获得了相同的环境,因为您将所有分配链接到同一个new.env()
调用。因此,当您指定一个时,您将全部分配给它们。
a <- b <- c <- new.env()
a
# <environment: 0x49c1ed8>
b
# <environment: 0x49c1ed8>
c
# <environment: 0x49c1ed8>
如果您希望它们是独立的环境,请不要将分配链接起来(即使用三个单独的呼叫new.env()
)。
为了完整起见,将Tensibai的评论带入 -
这是
<-
的副作用,您的代码行与a <- new.env(); b <- a; c <- a
相同(更明显地不会调用new.env()
3次,而是将其引用到3个变量名称)