我有2个数据帧df1和df2
都有3列:
c1, c2, c3
但是在df1的c3列中,我具有以下唯一标签:
l1, l2, l3, l4
在df2的c3列中,我具有以下唯一标签:
l2, l3, l4, l5
我想对这些标签进行编码,以便df1的最后一列的值变成这样:
1, 2, 3, 4
和df2:
2, 3, 4, 5
因此,编码的标签在两个数据框中应具有相同的名称。 标签不整齐。而且不常见的标签可能超过1个。
答案 0 :(得分:0)
使用以下命令:
>>> df1
c3
0 l1
1 l2
2 l3
3 l4
>>> df1["c3"].apply(lambda x: x[-1])
0 1
1 2
2 3
3 4
也将其应用于df2:
>>> df1["c3"].apply(lambda x: x[-1])