根据R中的条件重命名因子级别

时间:2019-03-16 12:36:45

标签: r dataframe rename

假设我们具有以下数据框:

data1 <- data.frame(S1 = sample(c("A", "B", "C"), size = 20, replace = TRUE),
                    S2 = sample(c("A", "B", "C"), size = 20, replace = TRUE),
                    number = rnorm(20, 10, 100))

还有这个变量:

scenario <- "scenario1" # can take one of thre values: 'scenario1', 'scenario2', 'scenario3'

还有以下映射。请注意,无法自动处理不同情况下的级别名称,例如使用正则表达式:

changer_1 <- c("A"="a1", "B"="b1", "C"="c1")
changer_2 <- c("A"="something", "B"="completely", "c"="different")
changer_3 <- c("A"="z2", "B"="d3", "c"="p14")

我想根据scenario的值(条件)重命名因子级别。到目前为止,我提出的是一个相当原始的if/else块,它检查条件,然后使用changer中的一个:

if(scenario=="scenario1"){
  data1$S1 <- revalue(data1$S1, changer_1)
  data1$S2 <- revalue(data1$S2, changer_1)
} else if (scenario=='scenario2'){
  data1$S1 <- revalue(data1$S1, changer_2)
  data1$S2 <- revalue(data1$S2, changer_2)
} else {
  data1$S1 <- revalue(data1$S1, changer_3)
  data1$S2 <- revalue(data1$S2, changer_3)
}

我想知道是否还有其他(更像R的方式)做到这一点?

1 个答案:

答案 0 :(得分:1)

一种方法是建立一个包含所有“场景”及其映射的列表

change_list <- list(scenario1 =  c("A"="a1", "B"="b1", "C"="c1"), 
             scenario2 = c("A"="something", "B"="completely", "C"="different"), 
             scenario3 = c("A"="z2", "B"="d3", "C"="p14"))

现在创建一个根据情况返回值的函数

get_values <- function(change_list, scenario, x) {
   change_list[[scenario]][x]
}

现在您可以调用该函数

get_values(change_list, "scenario1", data1$S1)

#  A    C    B    B    B    C    B    B    C    A    A    C    C    A    B  ...  
#"a1" "c1" "b1" "b1" "b1" "c1" "b1" "b1" "c1" "a1" "a1" "c1" "c1" "a1" "b1" ...

get_values(change_list, "scenario2", data1$S1)

#          A            C            B            B            B            C ..   
#  "something"  "different" "completely" "completely" "completely"  "different"..

通过这种方式,只有一个功能,您可以更改任何列中的所有值。