Question

有人可以向我解释这种行为吗？

a <- b <- c <- new.env()
a$this <- 1
b$this 
# 1
c$this 
# 1

我原本以为a / b / c会是不同的环境，就像以同样方式创建的变量一样？

但是，在全局环境中会显示三个环境，但是对一个环境的任何操作都会被推送到所有环境中。

Answer 1

免责声明：这个答案可能不完全是SFW，因为S-Expressions是R中所有对象的常见类型，缩写为SEXP（是的，S-EXPression，连字符不在你想象的地方）。现在SALT 'N' PEPA曾唱歌：让我们谈谈SEXP！

TL; DR：环境作为指针存储在其父环境中，复制变量以访问它，只需复制指针并仍然以同一对象为目标。

我做了一些根本原因的挖掘，主要原因是什么是环境，或者实际上，它是如何存储在它的父环境中的。我们来看看new.env：

> new.env
function (hash = TRUE, parent = parent.frame(), size = 29L) 
.Internal(new.env(hash, parent, size))
<bytecode: 0x0000000005972428>
<environment: namespace:base>

好的，是时候转到源代码了，names.c：

{"new.env", do_newenv,  0,  11,     3,      {PP_FUNCALL, PREC_FN,   0}},

搜索do_newenv会将我们带回builtin.c返回（我在此处使用了快捷方式，但让我们保持这不会太久）：

ans = NewEnvironment(R_NilValue, R_NilValue, enclos);

此NewEnvironment定义为here in memory.c，上面的评论为我们提供了有关正在发生的事情的线索：

通过扩展＆＃34; rho＆＃34;创建一个环境。用一个框架获得将标签上给出的变量名称配对在＆＃34;名单和＃34;随着由＆＃34; valuelist＆＃34;。
的元素给出的值

代码本身并不容易理解：

SEXP NewEnvironment(SEXP namelist, SEXP valuelist, SEXP rho)
{
    SEXP v, n, newrho;

    if (FORCE_GC || NO_FREE_NODES()) {
    PROTECT(namelist);
    PROTECT(valuelist);
    PROTECT(rho);
    R_gc_internal(0);
    UNPROTECT(3);
    if (NO_FREE_NODES())
        mem_err_cons();
    }
    GET_FREE_NODE(newrho);
    newrho->sxpinfo = UnmarkedNodeTemplate.sxpinfo;
    INIT_REFCNT(newrho);
    TYPEOF(newrho) = ENVSXP;
    FRAME(newrho) = valuelist;
    ENCLOS(newrho) = CHK(rho);
    HASHTAB(newrho) = R_NilValue;
    ATTRIB(newrho) = R_NilValue;

    v = CHK(valuelist);
    n = CHK(namelist);
    while (v != R_NilValue && n != R_NilValue) {
    SET_TAG(v, TAG(n));
    v = CDR(v);
    n = CDR(n);
    }
    return (newrho);
}

与gsetVar中的全球环境中的变量定义（例如，选择读者心灵的理智）相比：

void gsetVar(SEXP symbol, SEXP value, SEXP rho)
{
    if (FRAME_IS_LOCKED(rho)) {
    if(SYMVALUE(symbol) == R_UnboundValue)
        error(_("cannot add binding of '%s' to the base environment"),
          CHAR(PRINTNAME(symbol)));
    }
#ifdef USE_GLOBAL_CACHE
    R_FlushGlobalCache(symbol);
#endif
    SET_SYMBOL_BINDING_VALUE(symbol, value);
}

我们可以看到＆＃34;价值＆＃34;从父环境可访问的是新的环境地址，由GET_FREE_NODE在父环境中给出（我不确定我在这里清楚，但我没有找到正确的措辞）。< / p>

因此事实<-定义为x <- value我们正在复制指针，我们有多个自变量，都指向同一个对象。

使用任何引用更新对象会更新内存中唯一的对象。

SEXP代表各种文学的S-Expression，主要是C中的指针。

来自评论，

R language defintion，谢谢@BrodieG
A blog post about R's C interface
感谢@Alexis_laz强迫我以更细致的方式了解真正的根本原因。

Answer 2

new.env()只被调用一次，只创建一个新环境。它们都获得了相同的环境，因为您将所有分配链接到同一个new.env()调用。因此，当您指定一个时，您将全部分配给它们。

a <- b <- c <- new.env()

a
# <environment: 0x49c1ed8>
b
# <environment: 0x49c1ed8>
c
# <environment: 0x49c1ed8>

如果您希望它们是独立的环境，请不要将分配链接起来（即使用三个单独的呼叫new.env()）。

为了完整起见，将Tensibai的评论带入 -

这是<-的副作用，您的代码行与a <- new.env(); b <- a; c <- a相同（更明显地不会调用new.env() 3次，而是将其引用到3个变量名称）

分配多个环境

2 个答案: