我最近偶然发现replace()
和"[<-"
。它们似乎具有类似的功能,例如"[<-"
我可以这样做:
> x.tst <- array(1:6, c(2,3))
> s.tst <- array(0, c(2,3))
> s.tst
[,1] [,2] [,3]
[1,] 0 0 0
[2,] 0 0 0
> s.tst[1:3] <- 1
> "[<-"(x.tst, s.tst==1, 0)
[,1] [,2] [,3]
[1,] 0 0 5
[2,] 0 4 6
> x.tst
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
有人可以帮助澄清差异吗? replace
vs "[<-"
有什么优势,反之亦然?
答案 0 :(得分:7)
他们基本上完全一样。如果你看一下replace的源代码,你会看到:
function (x, list, values)
{
x[list] <- values
x
}
<environment: namespace:base>
所以替换只不过是[<-
:
> replace(x.tst, s.tst==1, 0)
[,1] [,2] [,3]
[1,] 0 0 5
[2,] 0 4 6
如果您需要执行此操作一百万次,使用[<-
可以为您提供加速,因为您将失去对包装函数的额外调用。但它确实很小,所以这是一个选择问题。我会说replace()
更容易阅读
顺便说一下,x.tst[s.tst==1] <- 0
比"[<-"(x.tst, s.tst==1, 0)
更容易阅读。没有理由使用该构造,除非您想将结果保存在新的数据框中。
正如@Andrie指出的那样澄清,replace()
和"[<-"(x.tst, s.tst==1, 0)
都会得到整个x.tst的副本,并且相关值已更改。所以你可以把它放在一个新的对象中。这与x.tst[s.tst==1] <- 0
相反,您可以在其中更改x.tst本身的值。请注意,它不会节省内存,因为在执行操作之前,R将在内部制作x.tst的副本。
计时结果:
> system.time(replicate(1e6, replace(x.tst, s.tst==1, 0)))
user system elapsed
12.73 0.03 12.78
> system.time(replicate(1e6, "[<-"(x.tst, s.tst==1, 0)))
user system elapsed
6.42 0.02 6.44
> system.time(replicate(1e6, x.tst[s.tst==1] <- 0))
user system elapsed
5.28 0.02 5.32