如何使用我自己在R中的自定义地图将值向量映射到另一个向量

时间:2013-08-27 04:31:00

标签: r vector

我想要一个函数,其输入是1s,2s和3s的向量,它发送1到.2,2到.4和3到.5。 (输出应该是一个相等长度的向量。)我该如何做到这一点?

例如,如果

myVector<-c(1,2,3,2,3,3,1)

然后是函数

mapVector(myVector)

应返回类似(.2,.4,.5,.4,.5,.5,.2)的矢量

2 个答案:

答案 0 :(得分:23)

有两个选项,全部使用:

myVector<-c(1,2,3,2,3,3,1)

<强>因子

newvals <- c(.2,.4,.5)
newvals[as.factor(myVector)]
#[1] 0.2 0.4 0.5 0.4 0.5 0.5 0.2

命名向量

newvals <- c(`1`=.2,`2`=.4,`3`=.5)
newvals
#  1   2   3 
#0.2 0.4 0.5 

newvals[as.character(myVector)]
#  1   2   3   2   3   3   1 
#0.2 0.4 0.5 0.4 0.5 0.5 0.2 

查找表

mapdf <- data.frame(old=c(1,2,3),new=c(.2,.4,.5))
mapdf$new[match(myVector,mapdf$old)]
#[1] 0.2 0.4 0.5 0.4 0.5 0.5 0.2

量化@Joe在下面的评论的基准,并解决@ Ananda的评论。

myVector <- c(1,2,3,2,3,3,1)
# setup for the benchmarking
test <- sample(myVector,1e6,replace=TRUE)
newvals <- c(.2,.4,.5)
newvalsvec <- c(`1`=.2,`2`=.4,`3`=.5)
mapdf <- data.frame(old=c(1,2,3),new=c(.2,.4,.5))

microbenchmark(
  newvals[as.factor(test)],
  newvalsvec[as.character(test)],
  mapdf$new[match(test,mapdf$old)],
  newvals[test],
  times=10L
)

#Unit: milliseconds
#         expr        min         lq     median         uq        max
#factor        1863.40146 1876.04197 1890.99147 1913.13046 2014.23609
#namedvector   1809.26883 1812.76272 1837.18852 1851.42954 1858.44996
#lookup          38.48697   38.83405   39.90146   69.65140   71.75051
#newvals[test]   34.07380   34.55885   50.61287   65.69495   66.08699

答案 1 :(得分:0)

install.packages("hash")
library(hash)
h<-hash(1:3, c(.2,.4,.5))
myVector<-c(1,2,3,2,3,3,1)
sapply(myVector,function(x){return(h[[as.character(x)]])})