我有一个庞大的数据集,我已将其作为表格阅读:
data = read.table("C:\\test\\test.tsv", header=TRUE)
View(data)
a b c
1 11 user
2 22 organization
3 33 user
4 44 user
5 55 organization
6 66 group
7 77 group
...
现在,我想将列c中的值更改为0(如果它们是用户),1(如果它们是组织)或2(如果它们是组):
a b c
1 11 0
2 22 1
3 33 0
4 44 0
5 55 1
6 66 2
7 77 2
...
我试过这个命令:
data$c[data$c=="organization"] <- 1
但我得到了这个警告:
警告讯息:在
[<-.factor
(*tmp*
,数据$ c ==“ORG”中,值= c(2L,NA,2L,NA)):无效因子水平,NA生成
并将所有“组织”值转换为NA。
我知道这个question,我的问题报告重复,但在这里,我们有一个表,而不是数据框。此外,转换是从String到整数。