R:将字符变量编码为数字

时间:2015-04-21 06:54:51

标签: r encoding character

在R代码中,我有一个字符变量var,其值为“AA”,“AB”,“AC”等。

str(var)
chr [1:17003] "AA" "AA" "AA" "AA" "AB" "AB" ...

如何将其转换为数字变量,以便将“AA”编码为,例如1,“AB” - 如2等

2 个答案:

答案 0 :(得分:9)

您可以将字符串转换为因子,然后转换为数字。

x <- c("AA", "AB", "AB", "AC", "AA", "XY")
as.numeric(as.factor(x))
# [1] 1 2 2 3 1 4

或者,您可以使用matchunique

match(x, unique(x))
# [1] 1 2 2 3 1 4

答案 1 :(得分:2)

  

您可以通过直接将它们转换为带标签的因子来使用它们。

x$Country = factor(x$Country,
               levels = c('AA', 'AB', 'AC'),
               labels = c(1, 2, 3))