如何在R

时间:2015-12-07 12:10:59

标签: r recode

我正在尝试在R数据帧中重新编码变量。示例 - 我的数据集中的变量X包含1和0。我想创建另一个变量Y,它重新编码1和& 0从X进入是&分别没有。

我试过这个来创建重新编码的Y变量:

w <- as.character()

for (i in seq_along(x))  {
    if (x[i] == 1)  {
        recode <- "Yes"
    } else if (x[i] == 0)  {
        recode <- "No"       
    }
    w <- cbind(w, recode)
}

然后我这样做是为了将X和Y排成一行:

y <- c(x, y)

我得到的是这个:

 y
 # [1] "1"   "1"   "0"   "1"   "0"   "0"   "1"   "1"   "0"   "1"   "0"   "0"   "Yes" "Yes" "No"  "Yes" "No"  "No" 

我期待一个带有X&amp; amp;的数据帧。 Y列。

问题:

  1. 如何将X和Y放入数据框?
  2. 是否有更好的方法来重新编码数据框中的变量?

3 个答案:

答案 0 :(得分:3)

重新编码通常是将新标签应用于因子(分类变量)的水平

在R中,你这样做:

w <- factor(x, levels = c(1,0), labels = c('yes', 'no'))

答案 1 :(得分:1)

使用以下数据:

x  <- c(rep.int(0, 10), rep.int(1, 10))
df <- as.data.frame(x)
df
#    x
# 1  0
# 2  0
# 3  0
# ...

我创建一个新变量并按一步重新编码:

df$y[df$x == 1] <- "yes"
df$y[df$x == 0] <- "no"
df
#    x   y
# 1  0  no
# 2  0  no
# 3  0  no
# ...
# 11 1 yes
# 12 1 yes
# 13 1 yes
# ...

注意for循环在R中不是最佳的,但是你的循环基本上是正确的。您需要在循环中将w <- rbind(w, recode)替换为w <- cbind(w, recode),在最后一步中,您可以cbind xw

w <- as.character()
for (i in seq_along(x))  {
  if (x[i] == 1)  {
    recode <- "Yes"
  } else if (x[i] == 0)  {
    recode <- "No"       
  }
  w <- rbind(w, recode)
}
y <- c(x, w)
y

rbind()附加行,cbind()追加列,c()将两个字符串连接在一起,这就是为什么你将两个列表连接成一个。

答案 2 :(得分:1)

这是你真的不应该在R中使用循环的许多情况之一。

相反,使用矢量化,即ifelse或索引。

result = data.frame(x = x, y = ifelse(x == 1, 'yes', 'no'))

(这假设输入中只有1和0;如果不是这种情况,则需要嵌套的ifelse或包含翻译的列表。