我有一个pandas数据框,其中有一列带有可变长度的列表。
ListCol
[a, b, n]
[a, c]
[n]
我现在想要的基本上是对这些列表进行一次热编码。所以基本上
a b c n
1 1 0 0
1 0 1 0
0 0 0 1
有没有办法做到这一点很简单?到目前为止,我要提出的是从列表中识别所有唯一值,并使用np.zeros()
将它们作为列添加到数据帧中,但现在我仍然坚持将实际要为每行设置为一个的值映射