R等有条件地将表中的字符串值替换为int

时间:2015-09-02 18:56:33

标签: r

我有一个庞大的数据集,我已将其作为表格阅读:

data = read.table("C:\\test\\test.tsv", header=TRUE)

View(data)
a   b   c
1   11  user
2   22  organization
3   33  user
4   44  user
5   55  organization
6   66  group
7   77  group
...

现在,我想将列c中的值更改为0(如果它们是用户),1(如果它们是组织)或2(如果它们是组):

a   b   c
1   11  0
2   22  1
3   33  0
4   44  0
5   55  1
6   66  2
7   77  2
...

我试过这个命令:

data$c[data$c=="organization"] <- 1

但我得到了这个警告:

  

警告讯息:在[<-.factor*tmp*,数据$ c ==“ORG”中,值=   c(2L,NA,2L,NA)):无效因子水平,NA生成

并将所有“组织”值转换为NA。

我知道这个question,我的问题报告重复,但在这里,我们有一个,而不是数据框。此外,转换是从String到整数。

0 个答案:

没有答案