用一些数值替换类似的列

时间:2016-11-26 08:42:12

标签: r data-science

我有这样的数据框:

Hashed_User_Id

[1] f2de2b4a6011a1ab52d3aefbc9b8a4103d7574f4 
[2] 88cb5d85c41abb7ad99595ceb7c2fc98409dd4dc
[3] 25313021517412ce58072d798ccea29ba5d2f427 
[4] f2de2b4a6011a1ab52d3aefbc9b8a4103d7574f4 
[5] 88cb5d85c41abb7ad99595ceb7c2fc98409dd4dc 
[6] 25313021517412ce58072d798ccea29ba5d2f427 

我想用数值替换这些散列值,为相同的值保持相同的数字,如下所示:

Hashed_User_Id

[1] 1
[2] 2
[3] 3 
[4] 1
[5] 2
[6] 3

我怎样才能做到这一点?

1 个答案:

答案 0 :(得分:1)

正如Ronak所说,

as.integer(as.factor(Hashed_User_Id))