最近我偶然发现了这段代码:
y <- NULL
y[cbind(1:2, 1:2)] <- list( list(1,2), list(2,3))
从第二个答案here开始。
但它似乎与y <- list(...)
没有区别,因为下面的比较显示:
> identical(y, list( list(1,2), list(2,3)))
[1] TRUE
> identical(y, y[cbind(1:2, 1:2)])
[1] FALSE
这里的括号分配是怎么回事?为什么它不会抛出错误?为什么它与最后一行代码中的非分配版本不同?
答案 0 :(得分:2)
矩阵索引仅适用于y
昏暗的情况。将此与标准R
回收相结合以及所有矩阵实际上都是向量的事实,这种行为是有道理的。
将y
初始化为NULL时,确保它没有暗淡。因此,当您通过矩阵(y
)对ind
进行索引时,您得到的结果与调用y[as.vector(ind)]
identical(y[ind], y[as.vector(ind)])
# [1] TRUE
如果ind
中有重复值并且您还要分配,那么对于每个索引,只会保留分配给它的最后一个值。例如,假设我们正在执行
y <- NULL; y[cbind(1:2, 2:1)] <- list( list(1,2), list(3,4) )
# y has no dimension, so `y[cbind(1:2, 2:1)]`
# is the equivalent of `y[c(1:2, 2:1)]`
当您指定y[c(1, 2, 2, 1)] <- list("A", "B")
时,实际发生的情况类似于:
y[[1]] <- "A"
y[[2]] <- "B"
y[[2]] <- "B" # <~~ 'Overwriting' previous value
y[[1]] <- "A" # <~~ 'Overwriting' previous value
以下是对发生的索引的进一步了解:(注意前两个字母是如何重复的)
ind <- cbind(1:2, 1:2)
L <- as.list(LETTERS)
L[ind]
# [[1]]
# [1] "A"
#
# [[2]]
# [1] "B"
#
# [[3]]
# [1] "A"
#
# [[4]]
# [1] "B"
这是同样的事情,现在有了任务。 请注意,仅保留了分配的第3个和第4个值。
L[ind] <- c("FirstWord", "SecondWord", "ThirdWord", "FourthWord")
L[ind]
# [[1]]
# [1] "ThirdWord"
#
# [[2]]
# [1] "FourthWord"
#
# [[3]]
# [1] "ThirdWord"
#
# [[4]]
# [1] "FourthWord"
尝试使用其他索引以进一步明确:
ind <- cbind(c(3, 2), c(1, 3)) ## will be treated as c(3, 2, 1, 3)
L <- as.list(LETTERS)
L[ind] <- c("FirstWord", "SecondWord", "ThirdWord", "FourthWord")
L[1:5]
# [[1]]
# [1] "ThirdWord"
#
# [[2]]
# [1] "SecondWord"
#
# [[3]]
# [1] "FourthWord"
#
# [[4]]
# [1] "D"
#
# [[5]]
# [1] "E"
L[ind]
# [[1]]
# [1] "FourthWord"
#
# [[2]]
# [1] "SecondWord"
#
# [[3]]
# [1] "ThirdWord"
#
# [[4]]
# [1] "FourthWord"
查看[
的src,我们有以下评论:
- 特殊[下标dim(x)== ncol(下标矩阵)
- 在VectorSubset中处理。转换下标矩阵
- 进入适当大小的下标向量,然后
- VectorSubset继续。
查看函数static SEXP VectorSubset(SEXP x, SEXP s, SEXP call)
,相关检查如下:
/* lines omitted */
attrib = getAttrib(x, R_DimSymbol);
/* lines omitted */
if (isMatrix(s) && isArray(x) && ncols(s) == length(attrib)) {
/* lines omitted */
...