我有一个像这样的数据框:
UserId Watched
553938 item1
553938 item2
553938 item3
309611 item4
在这里,UserId是我的索引列。我想将此数据帧转换为类似“一键编码”矩阵的格式,其中每个项目都是一个功能。 所以,我想要一个像这样的矩阵:
UserId item1 item2 item3 item4
553938 1 1 1 0
309611 0 0 0 1
但是,当我使用pd.get_dummies(df)
时,会得到以下数据框:
UserId item1 item2 item3 item4
553938 1 0 0 0
553938 0 1 0 0
553938 0 0 1 0
309611 0 0 0 1
之所以发生这种情况,是因为我的原始数据帧包含重复的userId(这也是我的索引)的固有结构
有没有一种方法可以实现所需的数据框?