我正在尝试使用data.table将因子变量重新编码为整数。给出:
group
005j
005j
0k16
0fff
0fff
我想得到一系列代表相同分组的递增整数:
group intCode
005j 1
005j 1
0k16 2
0fff 3
0fff 3
我可以用循环来做这件事,但它会非常慢。
答案 0 :(得分:10)
您只需使用.GRP
表达式中提供的j
符号,并使用by = group
定义组...
dt[ , intCode := .GRP , by = group ]
dt
# group intCode
#1: 005j 1
#2: 005j 1
#3: 0k16 2
#4: 0fff 3
#5: 0fff 3
引用?data.table
的帮助...
.GRP
是integer
,length
1,包含一个简单的组计数器。第1组为1,第2组为2,等等。