如何在多个熊猫数据框中编码标签?

时间:2019-10-03 09:23:02

标签: python pandas

我有2个数据帧df1和df2

都有3列:

c1, c2, c3

但是在df1的c3列中,我具有以下唯一标签:

l1, l2, l3, l4

在df2的c3列中,我具有以下唯一标签:

l2, l3, l4, l5

我想对这些标签进行编码,以便df1的最后一列的值变成这样:

1, 2, 3, 4

和df2:

2, 3, 4, 5

因此,编码的标签在两个数据框中应具有相同的名称。 标签不整齐。而且不常见的标签可能超过1个。

1 个答案:

答案 0 :(得分:0)

使用以下命令:

>>> df1
   c3
0  l1
1  l2
2  l3
3  l4
>>> df1["c3"].apply(lambda x: x[-1])
0    1
1    2
2    3
3    4

也将其应用于df2:

>>> df1["c3"].apply(lambda x: x[-1])