recode(car package)函数 - 重新编码参数和等号

时间:2016-04-04 12:57:11

标签: r r-car recode

我想知道是否允许在汽车套餐中=功能的recodes参数中使用等号(recode)?

例如,以下内容失败:

library(car)
n <- c(0, 10, 20, 21, 60, 70)
r <- recode(n, " 0:20 = '<= 20' ; 20:70 = '> 20' ")
# Error in recode(n, " 0:20 = '<= 20' ; 20:70 = '> 20' ") : 
# in recode term:  0:20 = '<= 20' 
# message: Error in parse(text = strsplit(term, "=")[[1]][2]) : 
#  <text>:1:2: unexpected INCOMPLETE_STRING
# 1:  '<
# ^

=移除<= 20可以正常工作:

r <- recode(n, " 0:20 = '< 20' ; 20:70 = '> 20' ")
table(r) 
r
# < 20 > 20 
# 3    3 

鉴于我在使用recode参数作为用户输入的上下文中使用recodes,我希望任何解决方案都不需要显式转义字符这是必要的,因为这将是繁重的。

我正在运行R版本3.2.3(2015-12-10) - &#34;木制圣诞树&#34;

3 个答案:

答案 0 :(得分:2)

car::recode总是会很痛苦,因为它解析recode字符串(如果它在任何地方包含“虚假”等号,它将会中断)。

对于您的特定应用程序cut效果很好:

n <- c(0, 10, 20, 21, 60, 70)
cut(n,breaks=c(-1,20,Inf),labels=c("<= 20", ">20"))

plyr::revalue对于一对一映射非常有用(另请参阅plyr::mapvalues):

x <- factor(c("a","b","c"))
revalue(x,c("a"=">= 20"))

我不知道一个很好的现成的多对一解决方案:

x <- factor(letters[1:8])
oldvals <- list(c("a","b","c"),c("d","e"),c("f","g","h"))
newvals <- c("new1","new2","new3")
for (i in seq_along(oldvals)) {
    m <- which(levels(x) %in% oldvals[[i]])
    if (length(m)>0) 
       levels(x)[m] <- rep(newvals[i],length(m))
}

如果新/旧代码以某种病态方式重叠,这可能会有点难看......

答案 1 :(得分:2)

  

鉴于我在我将recode参数作为用户输入的上下文中使用recodes

我不确定这意味着什么,但这是最终用户友好的:

map_em = function(
  n, 
  recs = readline(prompt = "enter map like key = value, key2 = value2: \n")
){
    m = eval(parse(text = sprintf("list(%s)", recs)))
    s = stack(m)
    s$ind[ match(n, s$value) ]
}

# usage example
map_em(n)
# enter map like key = value, key2 = value2: 
'<= 20' = 0:20, '> 20' = 21:70
# [1] <= 20 <= 20 <= 20 > 20  > 20  > 20 
# Levels: <= 20 > 20

因为它使用match,您的用户可以输入重叠值(就像OP一样,写0:2020:70),它只会进行第一场比赛。

类似地,用户可以直接在函数调用中传递映射:

map_em2 = function(n, ...){
    m = list(...)
    s = stack(m)
    s$ind[ match(n, s$value) ]
}

# usage example    
map_em2(n, '<= 20' = 0:20, '> 20' = 21:70)
# [1] <= 20 <= 20 <= 20 > 20  > 20  > 20 
# Levels: <= 20 > 20

答案 2 :(得分:1)

我有同样的问题,但没有找到任何解决方案。 这是我笨拙的解决方案,使用gsub

r <- recode(n, " 0:20 = '< 20' ; 20:70 = '> 20' ")
r <- gsub("< 20", "<= 20", r)