分配多个环境

时间:2016-02-03 16:39:31

标签: r

有人可以向我解释这种行为吗?

a <- b <- c <- new.env()
a$this <- 1
b$this 
# 1
c$this 
# 1 

我原本以为a / b / c会是不同的环境,就像以同样方式创建的变量一样?

但是,在全局环境中会显示三个环境,但是对一个环境的任何操作都会被推送到所有环境中。

2 个答案:

答案 0 :(得分:13)

免责声明:这个答案可能不完全是SFW,因为S-Expressions是R中所有对象的常见类型,缩写为SEXP(是的,S-EXPression,连字符不在你想象的地方)。现在SALT 'N' PEPA曾唱歌:让我们谈谈SEXP!

TL; DR:环境作为指针存储在其父环境中,复制变量以访问它,只需复制指针并仍然以同一对象为目标。

我做了一些根本原因的挖掘,主要原因是什么是环境,或者实际上,它是如何存储在它的父环境中的。我们来看看new.env

> new.env
function (hash = TRUE, parent = parent.frame(), size = 29L) 
.Internal(new.env(hash, parent, size))
<bytecode: 0x0000000005972428>
<environment: namespace:base>

好的,是时候转到源代码了,names.c

{"new.env", do_newenv,  0,  11,     3,      {PP_FUNCALL, PREC_FN,   0}},

搜索do_newenv会将我们带回builtin.c返回(我在此处使用了快捷方式,但让我们保持这不会太久):

ans = NewEnvironment(R_NilValue, R_NilValue, enclos);

NewEnvironment定义为here in memory.c,上面的评论为我们提供了有关正在发生的事情的线索:

  

通过扩展&#34; rho&#34;创建一个环境。用一个框架获得   将标签上给出的变量名称配对在&#34;名单和#34;随着   由&#34; valuelist&#34;。

的元素给出的值

代码本身并不容易理解:

SEXP NewEnvironment(SEXP namelist, SEXP valuelist, SEXP rho)
{
    SEXP v, n, newrho;

    if (FORCE_GC || NO_FREE_NODES()) {
    PROTECT(namelist);
    PROTECT(valuelist);
    PROTECT(rho);
    R_gc_internal(0);
    UNPROTECT(3);
    if (NO_FREE_NODES())
        mem_err_cons();
    }
    GET_FREE_NODE(newrho);
    newrho->sxpinfo = UnmarkedNodeTemplate.sxpinfo;
    INIT_REFCNT(newrho);
    TYPEOF(newrho) = ENVSXP;
    FRAME(newrho) = valuelist;
    ENCLOS(newrho) = CHK(rho);
    HASHTAB(newrho) = R_NilValue;
    ATTRIB(newrho) = R_NilValue;

    v = CHK(valuelist);
    n = CHK(namelist);
    while (v != R_NilValue && n != R_NilValue) {
    SET_TAG(v, TAG(n));
    v = CDR(v);
    n = CDR(n);
    }
    return (newrho);
}

gsetVar中的全球环境中的变量定义(例如,选择读者心灵的理智)相比:

void gsetVar(SEXP symbol, SEXP value, SEXP rho)
{
    if (FRAME_IS_LOCKED(rho)) {
    if(SYMVALUE(symbol) == R_UnboundValue)
        error(_("cannot add binding of '%s' to the base environment"),
          CHAR(PRINTNAME(symbol)));
    }
#ifdef USE_GLOBAL_CACHE
    R_FlushGlobalCache(symbol);
#endif
    SET_SYMBOL_BINDING_VALUE(symbol, value);
}

我们可以看到&#34;价值&#34;从父环境可访问的是新的环境地址,由GET_FREE_NODE在父环境中给出(我不确定我在这里清楚,但我没有找到正确的措辞)。< / p>

因此事实<-定义为x <- value我们正在复制指针,我们有多个自变量,都指向同一个对象。

使用任何引用更新对象会更新内存中唯一的对象。

SEXP代表各种文学的S-Expression,主要是C中的指针。

来自评论,

答案 1 :(得分:7)

new.env()只被调用一次,只创建一个新环境。它们都获得了相同的环境,因为您将所有分配链接到同一个new.env()调用。因此,当您指定一个时,您将全部分配给它们。

a <- b <- c <- new.env()

a
# <environment: 0x49c1ed8>
b
# <environment: 0x49c1ed8>
c
# <environment: 0x49c1ed8>

如果您希望它们是独立的环境,请不要将分配链接起来(即使用三个单独的呼叫new.env())。

为了完整起见,将Tensibai的评论带入 -

  

这是<-的副作用,您的代码行与a <- new.env(); b <- a; c <- a相同(更明显地不会调用new.env() 3次,而是将其引用到3个变量名称)