假设我们具有以下数据框:
data1 <- data.frame(S1 = sample(c("A", "B", "C"), size = 20, replace = TRUE),
S2 = sample(c("A", "B", "C"), size = 20, replace = TRUE),
number = rnorm(20, 10, 100))
还有这个变量:
scenario <- "scenario1" # can take one of thre values: 'scenario1', 'scenario2', 'scenario3'
还有以下映射。请注意,无法自动处理不同情况下的级别名称,例如使用正则表达式:
changer_1 <- c("A"="a1", "B"="b1", "C"="c1")
changer_2 <- c("A"="something", "B"="completely", "c"="different")
changer_3 <- c("A"="z2", "B"="d3", "c"="p14")
我想根据scenario
的值(条件)重命名因子级别。到目前为止,我提出的是一个相当原始的if/else
块,它检查条件,然后使用changer
中的一个:
if(scenario=="scenario1"){
data1$S1 <- revalue(data1$S1, changer_1)
data1$S2 <- revalue(data1$S2, changer_1)
} else if (scenario=='scenario2'){
data1$S1 <- revalue(data1$S1, changer_2)
data1$S2 <- revalue(data1$S2, changer_2)
} else {
data1$S1 <- revalue(data1$S1, changer_3)
data1$S2 <- revalue(data1$S2, changer_3)
}
我想知道是否还有其他(更像R的方式)做到这一点?
答案 0 :(得分:1)
一种方法是建立一个包含所有“场景”及其映射的列表
change_list <- list(scenario1 = c("A"="a1", "B"="b1", "C"="c1"),
scenario2 = c("A"="something", "B"="completely", "C"="different"),
scenario3 = c("A"="z2", "B"="d3", "C"="p14"))
现在创建一个根据情况返回值的函数
get_values <- function(change_list, scenario, x) {
change_list[[scenario]][x]
}
现在您可以调用该函数
get_values(change_list, "scenario1", data1$S1)
# A C B B B C B B C A A C C A B ...
#"a1" "c1" "b1" "b1" "b1" "c1" "b1" "b1" "c1" "a1" "a1" "c1" "c1" "a1" "b1" ...
get_values(change_list, "scenario2", data1$S1)
# A C B B B C ..
# "something" "different" "completely" "completely" "completely" "different"..
通过这种方式,只有一个功能,您可以更改任何列中的所有值。